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有很多书籍都对实证主义范式做了详尽的介绍， 〈社会 科学研究的思维要素> 是其 
中最值得推荐的佳作 之一： 在25年中，能在美国先后出版9个版本（由于时间差， 
本书对照的是原书第8版）的学术性畅销著作，这显然意味着它在许多方面有过人 

之处。 


这本小册子不是很深奥，亊实上它是社会科学的入门读物，旨在帮助那些使用社会 
科学研究成果的人和那些将迈开研究生涯第一步的研究者。本书将处理诸如此类的 
基本 问题： ' ^ 


•概念从何而来？ 

•何为变置7 
• 为何要科学思维？ 

• 有关现实的假说如何区别于其他的陈述？等等。 


我们力图帮助读者识破有关社会科学的某些错误印象，尽可能帮助他们踏出研究的 
第一步。全书强调的是现实检验，该检验是我们赖以认识世界构成的一种过程。这 
是对科学的一种泛泛介绍一我们鼓励读者既在日常思维中，也在社会科学方法的 
具体运用中保持科学的态度。 


万卷方法博 客阍： 
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前译 

言者 


尽管最近几 f * 年来不断有人著书立说，试图为社会科学研究树立一种“建构主 
义” （ 亦称“自然主义”）模式，以取代盛行的实证主义范式。无论取代的理由如何， 
但有一件几乎能被所有人认同的事实是，实证主义的研究成果正在越来越广泛地 
影响到社会生活的方方面面，并且在许多领域，尤其在经济领域取得了巨大的成 
就，为人们预测乃至控制社会现象軔良性发展做出了巨大 贡献； 相较起来，预测、控 
制社会现象从来就不是建构主义范式的主旨，要取得对等的成就即便不是完全不 
可能，似乎也是一件遥远的事。因此，实证主义范式仍是社会科学研究的酋选模 
式，任何人想要迈入社会科学研究领域，都应该通晓这种范式的特点、构成和研究 
步骤,， 

有很多书簖都对实证主义范式做 r 详尽的介绍，但《社会科学研究的思维要 
家》是最值得推荐的佳作之一：在25年中，能在美国出到第9版（由于时间差，本书 
对照的是原书第8版）的学术性畅销著作，显然恧味竚它在许多方面的过人之处。 
本书尽符篇幅不大，内容也不像一般的著作那样深奥，但它有力地论证了科学思维 
方式的歌要性，简练淸晰地介紹了科学思维的各种要家，包括概念、变袱、假说等， 
还用典型的研究范例展示了社会科学问题的研究步骤。当然，这里的介绍有点画 
蛇添足之嫌，因为作者本人在前言中就有比较具体的介绍，而再具体一驻的就是著 
作本身了。我们逑议，无论是已经在从铒社会科学研究的学者，还是即将踏入社会 
科学门槛的新生，都应好好地阅读这本《社会科学研究的思维要 素》； 该书对于前 
者也许有启发作用，对于后者则是优秀的入门教材。 

原书的译文是合作努力的结果，由李涤非和潘磊协力完成，分工 如下： 李涤非 
翻译前言和第1 〜 4章:，潘磊翻澤第5章、第6章和附录 A 、 附录 B , 最后由李涤非统 
稿。为了保证翻译质《•我们在校对时参考了台沔张家麟陴士（在此对张博士致以 
谢意）的译本，在个别地方 吸取了 其精华（如译文第50页，“成为一位有远见卓识 
却昙花一现的女英雄”中的“昙花一现”〉，不过也避免了出现在张译本中的一些不 
足甚至 错误。 当然，不论我们做到如何的谨慎细致，总有不如意的地方，还恳请读 
者批评指正。 

M ： 后特別感谢重庆大学岀版社的黹少波和陈进对我们的厚爱，把如此 一本重 
要著作的翻译工作托付给我们•希塑我们的努力对得起他们的信任。 


译者 
2008年1月 



前作 

言者 


这本小册子不是很深奥，事实上它是社会科学的入门读物，旨在帮助那些使用 
社会科学研究成果的人和那些将迈开研究生涯第一步的研究者。概念从何而来？ 
何为变撤？为何要科学思维？有关现实的假说如何区别于其他的陈述？其相似性 
是什么？本将处理诸如此类的基本问题。 

我们的意图在于帮助读者识破有关社会科学的某些错误印象，尽可能帮助他 
们踏出研究的第一步，至于研究技巧的详尽细节，则有待参考更详细、更专业的资 
料。令书强凋的是现实检验，该检验是我们赖以认识世界构成的一种过程。这是 
对科学的一种泛泛介绍——我们鼓励读荇既在 R 常思维中，也在社会科学方法的 
具体运用屮保持科学的态度。 


第8版的变化 


这本朽扱初出版于25年前，当时作者肯尼斯 • 赫文 （Kenneth Hoover ) 还是一 
位年轻的政治理论学者，他回顾了自己在社会科学方面所受的教疗，尝 试矜厘 清一 
关键概念和技术，以便新一代的大 学生能 够理解它们。作者 M 初反感定》分析 
和政治学的科学研究方法。不过，他逐渐认识到，它们有助于回答汉争 • 皮特金 
(Hunnu Pitkin ) 认定的作为理论家都要涉及的根本问 题：如 何改善人类的境况？我 
们无力改变的是什么？或许本彳$的长寿归功于它起源于方法论之外的领域，归功 
T •它有意帮助那些对社会变化感兴趣的学生掌握社会科学的一些工具。 

在第8版《社会科学研究的思维要素》中，我们延续了理论家肯尼斯 • 赫文和 
行为分析家托德 • 多纳 （Todd Donovan ) 的合作，他们完成了此次修订的主要工作。 
多纳运用了大 M 的调査和统汁技术，集中关注公民如何能参与大众民主。我们一 
直致力于以其他形式的“认知”为参考来定位科学知识，以便学生能识破阻碍有关 
讨论的某些陈腔滥调，核心教导依然是 ：通过 观察我们只能局部认识构成世界的 
各种现象，而科学旨在减少世界的不确定性。此书的重点在于了解观察能做到 
什么。 

我们还一贯强调直接的说明。我们做了许多小改动，然而，统计工具日益增长 
的复杂性，以及有助于这些工具传播的计算机的广泛普及，使我们觉得有必要扩展 
与研究技术相关的内容。为了满足社会学家、政治学者，以及其他社会科学家的广 
泛耑要，我们改换了一个附录，以收入一些研究问题的范例。新的附录 A 介绍了有 
关美国“社会资本”衰退的讨论，以表明学者是如何研究社区参与和政治参与之间 



iv '' 社会科学思维要索 

逐渐变化着的关系。 

我们^信，在那些做定量研究和不做这种研究的社会科学家（以及所谓的实证 
主义者和反实证主义者）之间的争论，有助于拓宽社会科学家的研究工具和研究前 
景。这种争论也消耗了大 量能量 和精力，现在最好是善用它们，使我们能对社会分 
析技术做建设性的使用 3 不说其他，显而易见的是，没有一种方法可以提供所有答 

案，任何方法都有其独特的缺陷，都可能导致偏见。选择合适的方法论或方法论的 
组合，是关键的考虑。 

当$会科学家投入这些争论时，社会问题似乎变得愈加 复杂更 难解决。如果 

审慎观察对于理解这些问题至关重要，那么社会科学就扮演了一个关键角色 

经典的科学研究规则提供了一种框架，用于解决在真理这个敁有争议的主题 

上的冲突，即便冲突发生于彼此特别反感的人之间。我们尤其需要用系统的分析 

来考察源内各种洞见的有用观念，以便能把彼此冲突的观点消解在富有成果的活 
动形式之中。 


如何阅读本书 


人多数书籍适合于从头到尾一气贯通地阅读。对于许多读者而言，这也是阅 
读本书的 M 好方法。然而，读者应该怠沢到，本书的各饫对社会科学思维的考察乃 
足立足 T +问 的;， I 次。基于该原因，本书的人手有各种出发点，依读者的黹要而 
定。人们对為关周边世界的问题的探索性回答有—些方法，第1康“科学化的思 
维”就是把社会科学置于这样一个普遍的语境中。第 2 饫“科学的要素•，通过讨论 
概念、变撤、测最、假说和理论，提出了科学方法的基本轮睇 


对十那 些直接承担研究任务或理解研究的人来说，第 3 隹“策略•，是个很好的 
起点，因为它直接讨论了科学研究的具体细节。第4章••提炼•，假定读者对第 2 茂 
中说明的科学方法已经有了基本理解，在此基础上提供了额外的研究工具。第 5 
y 变 W 与关系的测僚”探讨的是 测敢的 艺术和科学。我们认为，出于任何目的而 
使用本 R 的人都应该阅读第6章“ 反思： 追根溯 源”。 该结论章的要旨是摆正科学 
理解的位贤，并从总体上指出，在哪里应该做到 谦荦在 哪里可能取得成就 

，为 r 方便读者温习，在每章结尾，依出现的先后顺序编排了该章的主要概念 
附录 A 摘选 f 罗 伯特. 普特南 （Robert Putnam ) 所写的一篇题为《调来调方 •. 
美国社会资本的奇怪消失》（。似七 k T— ou^.TheFtrange Disappearance of 

S ° Clal CapUal in 的文章。本书频繁引用了该文，那些需要一个好的模型来 

生成研究问题的人应该细心阅读。附录 B 是由 大卫. 布洛金顿 （David Brooking - 
ton ) 、托 德. 多纳 （Todd D onovan ) 、 肖恩. 鲍勒 （Shaun Bowler ) 和罗 伯特. 布里斯 
mb ( Robert Brischetto 〉 合写的一篇文章《累积和限制投票制下的少数族群的代表 

性》 （ A / mori ^ Representation under Cumulative and Limited Voting ) ，该附录的内容 作 
仅与第 5 章頓刚分娜 —节有关。 〜爾補内 合仅 


欢迎读者对本书提出意见，联系方式 ：Departmem of PoIitica| science . Western 
Washmgton University , Bellingham , WA 98225 ，或者通过电子邮箱： Ken . Ho ove @ 
^ wu . edu igcdonovan @ cc. wwu . edu ' 
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科学化的思维 

Thinking Scientifically 



“科学探索人们的共同 经验； 它被人建构，具有人的风格 

-雅各布 • 布鲁谨■维奇 （Jacob Bronowski ) 

“社会科学”这个冷冰冰的字眼给人的印象是，一些机器人在统计实验室 
里把人类行为化归为奄无生气的数字和简单的公式。研究报告充斥若诸如 
“经验的”、“定 世的” 、“操作的”、“反向的”和“相关的”这些生硬的词语，没什 
么诗意。但我们将力 阌表明 ，对社会科学的这种老衮看法是错误的。 

与其他的认知模式一样，社会科学可以用于邪恶的目的，但也可以用来促 
进仁慈之士的个人理解。利用对现实的观察来检验思想，科学有助于解放研 
究，使之免于成见、偏见和十足的混乱。因此，仅仅由于老套的#法而退缩不 
前，不是明智的做法•.太多人接受了科学的老套形象，因而把他们自己从事社 
会科学理解的能力拒之门外。 

在我们的文化中，科学一词涵盖了许多意义，有些人其至认为它是宗教在 
现代的继承者。在这里，我们的 H 的不是考察有关科学的所有纠鈴，而是要找 
到一条通向科学思维的途径。为此，我们首先对比其他形式的知识，来看看对 
科学的某些描述。 

首先，我们需要识别一些应加以忽略的令人分心之事。科学有时被混同 
于技术，技术是科学在各种任务上的应用。小学课本在太空遨游图片旁附上 
“科学在前进！”的标题，助长了这种混淆。技术使太空遨游成为可能，它使用 
了推进力的研究、电子学和许多其他领域里的科学策略。探索模型才是科学 
的； 太空船则从属于技术。 

正如科学不同于技术，科学也不是某种具体的知识体系。“科学告诉了 
我们（比如）吸烟可致命”，这句流行的话实际上是一种误导。“科学”不告诉 
我们任何 事情； 告诉我们事情的是人——在这个例子中，是那些运用科学策略 
调查了吸烟与癌症之间关系的人。科学作为一种思维和调查方法，我们不应 
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把它看做存在于书本、机械和含有数字的报告中，而最好认为它存在于心灵这 
个无形的世界中。科学与问题的提出和回答方式 相关； 它是用于探索的一套 
规则和形式，由那些寻找可雒答案的人们创造。 

另一个分心之事是把某些特殊的人认作“科学家”。这种用法并不错，因 
为被这样称呼的人，实践的是科学的探索 形式； 但说某些人是科学家，而其他 
人不是，并不是完全公正的做法。虽然有些人精于用科学方法获取知识，但我 
们所有人都是科学思维方法的实践者。科学是一种探索模型，为全人类共同 
拥有。 

当你更深刻地意识到自己的思维习惯时，你就会发现，我们每个人都有那 
么点“科学家”的意味。我们测量、比较和调整信念，获得对日常事务中的有 
关证据的理解，为下一步计划做出打算，并找出与别人打交道的方法。最简单 
的游戏也牵涉到运用执行数据来检验方法和策略，而这已初具科学的形态了。 
即便为了给他人留下深刻印象而试穿不同风格的服饰，也包含科学的要索。 

我们有许多策略用于应付承大的现实问题——生命的不确定性，科学思 
维方法只是其中的一种。我们并不知道许多行为的结果。我们也可能不清楚 
某拽压力，它们在微妙地或直接地、逐渐地或陡然地影响矜我们。即便在尝试 
完成设简单的任务时，比如计划吃什么，我们也在做一些基本的 盘箅： 哪些食 
物的味道好，哪些食物对我们有益。如果这样做还是太不确定，那么稍微深人 
的检验是个不错的 主怠： 女王有品尝员，而我们其余的人至少在#到某种汉堡 
时，也可以确定它早就卖出数十亿个了。 

科学是一种思考和提出问题的过程，而非一种知识体系。我们有许多方 
式声称我们知道某事，科学只是其中的一种。在某种意义上，科学方法是一鸾 
标准，用于决定如何解决不同的现实观之间的冲突。科学为研究者提供问题 
研究的策略。科学为运用研究结果的人提供一种能力，使他们能批判性地评 
估如何提出和使用证据来达到结论。 

在寻求理解方面，科学方法有许多竞争者。纵观绝大部分历史，对于许多 
人来说，获胜的是那些竞争者。对现实的分析一般不如神秘、迷信和预感那样 
流行，后者在它们试图预测或控制的事件发生之前使人有确定感，尽管亊后发 
现很少如此。有时候，未被证实的信念促发一种受激发的行为，或是让怀疑者 
继续犹豫不前，直到更好的时机来临。确实，某些个人信念构成了我们生命的 
重要部分。关键是，拒绝分析是自断其臂，而熟练的分析者则占得先机。 

为何要系统化 


大多数人类交流发生在小群体中，他们拥有共同的语言、大量的对周边世 
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界的共同经验和理解，要达成彼此间的一致很容易。但在较为复杂的社会环 
境中则很难如此。尽管家庭能通过故事和箴言的传承，在代与代之间传递智 
慧，但在社会中却有麻烦。用最悲观的形式来表达，问题 就是： “要相信谁的 
故事？”理解周边世界、与其他人分享经验的需要，使系统的思维和探索变得 
至关重要。 

社会因其戏剧性的事件而引人入胜，因此人们倾向于摒弃系统的理解，而 
习惯于描述、故事和个人判断 3 尽管它们可能具有启发性，但通常作用有限， 
因为对生活所做的高度主观的描绘，对于发展共同理解和共同活动来说，是糟 
糕的基础。 

要在各自经验的独特性而造成的差异之间架起沟通的桥梁，这种复杂的 
任务黹要运用训练有素的方式来获取知识。只有能加以运用的知识，才能成 
为推动社会发展的力 W 。 社会知识要有用，必须是能交流的、有效的和有说服 
力的。 

为了能被交流，知识的表达形式必须清晰 o 如果要把知识用于促发行为， 
它必须是有效的，这就要求有恰当的 证据； 还必须是有说服 力的； 它要适合于 
被提出的问题。“我认为资本主义在剥削穷人”，这类个人意见可能令你的朋 
友，甚至亲戚认为，我们的社会存在某种不公。然而，如果你能举证，在美国六 
个孩子中至少有一个生活在贫闲中，你就会得出更有说服力的结论，因为你把 
判断与一种对现实的测 M 关联起来了。①那些即便不痨欢你但提倡财洛分配 
公正的人，可能就会觉得这种陈述对于批判性地考察我们的经济体系，是条有 
力的线索。知识建立于证据之上，以淸晰的、可传达的形式表述，促进对环境 
的改造。 

积粜知识以避免过去所犯的错误，通常会孕脊出文明化的人性。人们能 
记录智者的格言，这为文化的发嵌作出了极大的贡献。但无可贤疑，存在另一 
种积累方式••建立受证据支持且可以被他人加以复査的陈述。对陈述的笈査， 
需要当事人准确地知道陈述的是什么，如何检验陈述。这是科学事业的一个 
主要组成部分。第2章关于科学方法的一节所讨论的步骤，是完成那类认知 
过程的指导方针。 


①参见 National Center for Children in Poverty, M Low Income Children in the United States ： A 
Brief Demographic Profile. M Mailman School of Public Health. Columbia University. April 4, 2002 
(http://www.nccp.org) 。 该报告使用了美国人口普査机构从 1976 年 3 月到 2001 年 3 月的数 
据，而且指出 ， 15. 8% 的儿童生活在贫困中。这是自 1978 年以来贫困儿童的最低水平。 
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社会科学研究的思 m 要索 


有理判断和意见的角色 


关于系统思维的所有这些带有模糊预示性的说法，并不是要排除有理判 
断、意见和想象。毕竟，在任何知识探索中限制心灵的能力，都不怎么明智。 

有理判断是人类理解的主要组成部分。有理判断与证据之间有相当程度 
的关系。因为人们难免在缺乏完整证据以供决策的情况下采取行动，所以 
“判断”这个词语很重要。判断意味着决策，在该过程中，心灵的所有能力都 
被调动，以使可资利用的知识发挥最大效用。 

社会科学并不排除判断在研究过程中的 角色。 事实上，在科学证据的搜 
集和评估中，判断扮演着重要的角色。我们可以观察到，美国前10%的家庭 
的收人比后10%的穷人的收人高55倍。 M 甯有家庭的收入在最近的经济繁 
荣期以15%的速度递增，穷人的收人则停滞不前。不过，把该证据与资本主 
义、不平等、贫困、财离、剥削、生产力、经济发展以及其他广泛的社会问题关联 
起来，则是另一回事。我们需要用逻辑和良好的判断来解释这个证据 。② 

有理判断是系统思维的第一个部分。“选举日的前夕若是满月，则能促 
进自由派投票 "，这 个命题可能是正确的，但它并没有反映出多大的有理判 
断，因为既无证据把两个事件连接起来，它们之间也无逻辑上的关联。有空闲 
又有资源的研究者可以考察这样一个命题，但在这个世界中，时间紧张、资源 
趼乏、社会分析占用的都是稀缺人才这些严敢问题充斥茬的世界中，这样的研 
究可就没什么怠义。③尽管那个命题呵能合乎直觉，但即使是直觉也通常与 
经验及证据有某种关系。 

意见在科学分析中同样扮演一个必不可少的角色，因为所有的探索努力， 
都源自某种个人兴趣。只有对结论感兴趣，人们才会提出问题。此外，不同的 
人观粮现实的角度必然会略有不同。探索中的怠见不能消除，但能加以控制， 
不致使其变成十足的幻想。对于研究者而言，有助于减少意见角色的一种方 
法是，留意自己的价值和意见 3 


② 参见 Shannon McCafTery , *' Income Gap Growing . •• Associated Press Wire Service ( January 
18， 2000) o Richard W . Stevenson , *' Income Gap Widens Between Rich and Poor in 5 States and 
Narrows in 1 . !^exv York Times ( April 24 , 2002). Michael Houl and Samuel Lucas , “Narrowing the 
Income Cap between Rich and Poor ,” Chronicle of Higher Education , Section 2 ( August 16, 1996) , 
BI-B2 。 这些研究表明，在 1996 年，富人和穷人在收入上的差距自 W 21 年后达到最大，而且在继 
续拉大。 

③ 不过 ，警察 和酒吧侍者会告诉你•事实上，满月之夜会发生相当奇怪的行为，这个假说并 
不完全是荒谬的。 
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这里用得上柏拉图的一句名言 •.“ 认识你自己。”有些人自诩他们是客观 
的，他们在研究中隐藏了自己的意见，而实际上正是这些意见悄然地建构了他 
们的结论，这些人对优秀的社会科学事业造成了大最伤害。没有人是真正客 
观的，对于社会本质的看法当然也不是客观的——其中掺杂了许多个人利益。 

从根本上说，优秀的科学自身会考察探索中的价值所造成的影响。如果 
研究方法和用于支持结论的证据被清晰、充分地陈述，我们就能检査结论与证 
据的匹配度。如果对研究过程的有效性抱有怀疑，我们还能够对研究本身进 
行复査，或用技术化的术语来说，就是“复制”。这一特征把科学与个人判断 
区分开来，并使科学免于个人成见。 

不像心灵处理内在的感受、对经验的知觉和思维进程，没有人能够复査所 
有发生的事情。科学把探索步骤带出心灵，引入大众的视野中，使之作为知识 
积粜过程的组成部分而被所有人共享。 

想象、直觉和习俗的角色 

心灵有许多认知方式，但都不如在想象中显得那么巧妙却又那么神秘。 
如果人们还能够一跃跨过高岛的障碍物的话，那就是心灵的飞跃。但是，想象 
一条关于现实的可能命题是一回事，而狞手去想象证据，则完全是另一回唞。 

科学的实质在于找出我们 有所了 解的审物间的关系。提出一种关系，是 
•一种创造性和想象性的活动，然而，这可能 X 要大 tt 系统的准备工作。用现实 
检验命题，牵涉到不同层次的想象——主要是一种能 力：从 那些源于现实、零 
芩散散的信息片断中，找到一条信息，它对于检验某个特定观念的可信性而言 
是必不可少的。 

正是在探索发现领域，科学与想象结成了亲密伙伴。自然科学的历史中 
到处都是这类例子，既包括认识到地球围绕太阳运转，而不是相反，也包括发 
现物质是由微小的原子所构成的。其中每项发现都是由那些大胆而富有想象 
力的人做出的，他们参照现实世界中的证据，不怕挑战惯常的信念结构。尽管 
这些都是大尺度的发现，但都包含相同的努 力：步 出对人类行为所做的公认说 
明，想象其他的可能性，并合理地运用证据来检验它们。当女性主义者在考察 
男女区别的传统看法时，就是这么做的。要真正富有想象力，有点类似于试图 
摆脱重力的束缚——万事开头难。虽然到现在为止，社会科学中很少有能够 
与自然科学中的丰功伟绩相匹敌的发现，但把科学运用于社会关系，只是最近 
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的事，而且是复杂得多的工程。④ 

从基本层次上说，正是有了好奇心，想要发现无序中的有序，才有了科学 
探索。看到一系列令人困惑的事件、事变和行为，我们急于了解为什么某些事 
发生了，事件产生的原因是什么。社会科学能满足我们的好奇心，使我们获得 
理解。从另一层次来说，社会科学制造可以交流、可以用来把我们的理解解释 
给他人听的知识。 

无论我们对科学分析所要求的审慎思考持什么样的看法，仍旧无法完全 
把握“有个主意”这一奇妙的过程。科学决不是排斥直觉和想象的一个体系， 
相反，它是一套程序，使这类观念在人类智力允许的范围内尽可能变得富有成 
果和创造性。即使是最奇妙的观念，其作用也来源于它与当前的或潜在的某 
种现实之间的关系。科学是一门现实检验 艺术： 形成观念并从有关现象中引 
出可观察的证据来检验它们。 

步出一般模糊不淸的人类关系，构想其他的可能性，需要一种异乎寻常而 
乂必不可少的想象力。说来遗憾的是，就通常的社会和政治经验而言，大卫 • 
休谟 （ David Hume ) 的观察或许是正确 的：“ （人 们） 一旦习惯顺从，就不会想到 
步出他们及其先祖踏出的道路，步出这条被许多急迫且明显动机所限制的道 
路。” 5 然而，正是在对社会、政治布局的理解和革新上，世界黹要严潢想象的 
M 佳运用。如果在缺乏想象的悄况下理解社会现实，我们就会困在习俗这条 
老路上，就会陷人窒息人类潜能的不公之中。 

同样，我们也许会局限于一些徒劳的行为习惯。英格兰拧经有个惯 例：当 
众绞死扒 f •以藤慑其他人的偷盗行为。然而，有人观察到，比起其他公开事件 
来说，越在绞刑的场合，偷盗事件越多。这种惯例存在的时间超过了这么点社 
会科学的发展历史，其实它远不该存在那么久的。 

习俗并非全然是坏事，因为它可能包含长期以来的教训，学自对现实的体 
验，经常是不愉快的体验——在不严格的意义上，习俗裤是科学的。习俗经常 
在大擻的，甚至激烈的压力下把社会群体团结在一起。不过，任何社会科学的 


④ 也许用 科学考察社会习俗的最毕努力之一，是英国科学家弗朗 西斯. 盖尔顿 （Francis 
Galton ) 在世纪末做出的.他检验的是祈祷的灵验。他观察到，每天在各地教堂里都有祈祷皇 
室长命 tf 岁的祷告，他把他们的寿命与贵族们的和各种职业人士的寿命做了比较。他发现，排 
除意外或楗力导致的死亡，并只涵盖那些寿命超过 30 岁的人群，皇室成员的平均寿命是糾’⑽ 
岁，这在他的分类观察中是最低的。不过，盖尔顿确实注意到，除了满足一些需求外，祈祷还有 
许 多个人 用途。而且，谁又知道•如果不做这样的祷告，皇室成员可能更短寿呢。 P . B . Medwar , 
Induction and /ntuuion in Scientific ( Philadelphia : American Philosophical Society , 1%9), 

PP-2-7. * 

⑸ David Hume , “Ofthe Origins of Government, M Political Essays , ed. Charles Hendel (New 
York: Liberal Arts Press, 1953) , p. 41. 
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任务都必须是理解事物的存在方式，理解如何革新社会生活的元素，以适合更 
人性化的个人发展与表达的模型。在追求理解时所使用的工具，不只是用训 
练有素的程序进行探索的科学，还包括一些直觉 ：生活 能过得比现状更好，某 
种行为模型可能并非不可避免，微不足道的行为交流或许是向更大的可能性 
和潜能迈进的关键。 

任何理解工作所采用的方法，都牵涉到思维与调査之间的张力。连接这 
两个要素的方式各种各样。神秘主义者察觉到一种内在的真理，用一呰“征 
兆”来解释其洞见的有效性。历史学家从过去的历史中寻找模型，并认为它 
们可以用于解释事件的意义。比如，欧洲“中产阶级的崛起••成了历史学家用 
于解释的主要概念。而具有科学精神的人努力做到比神秘主义者更具体，比 
历史学家更精确，他们关注研究的指导思想，调査中被视为重要的数据，以及 
对照现实以检验心理建构的测量方法。 

在后面几章，我们将逐一考察建构科学理解的步骤。正如你将看到的，这 
种技术更多的是需要常识，而不是技术知识或精心准备。 


引入的概念 


科学 （ science ) 

技术 （technology ) 

可交流的知识 （communicable knowledge ) 
有效知识 （valid knowledge ) 

有说服力的知识 ( compelling knowledge ) 
有理判断 （reasoned judgment ) 

讨论 


意见 ( opinion ) 
客观性 （ objectivity ) 
想象 ( imagination ) 
直觉 （ intuition ) 

习俗 （ custom ) 


1. 非科学的理解摸式有何实洌？如何用这些非科学的模式来解释下述 问题？ 

• 为什么某些国家比另一些国家富有？ 

• 为什么政治革命发生在某些地方而不是在其他地方？ 

• 明年的世界职业棒球大赛中谁会获胜？ 

2. 社会科学知识如何比其他的知识形式（比如直觉、习俗）更有效力？其缺点 
和危险是什么？ 

3•科学知识如何用于改革或改变 社会？ 

4•为何想象对于社会科学至关重要？ 

5.想象的运用对于社会科学来说，是否比对自然科学 （如 化学、生 物学） 更 
重要？ 




科学的要素 


Hie Elements of Science 



“（科学探索〉起始于我们发明的一个关于可能世界的故事，随着推进，我 
们批判和调整它，最终尽可能使之变成一个关于现实世界的故事。” 

- P . B . 梅达沃 （ P . B . Medawar ) 

我们已经尝试荇参照其他类型的思维讨论了科学思维，指出了我们为什 
么应该对科学感兴趣^现在该是我们了解科学构成的时候了。 

科学策略的元家本身很容易理解。它们是一些槪念、变鱿、假说、测锨和 
理论。这些元家的组合方式，构成了科学方法。理论的功能是引导出这种方 
法、賦予它意义，这是通过帮助我们解释被观察到的现象来实现的。首先，我 
们试猗摆正每个要索的位 咒。 

槪念的起源和功用 

假如清除你心中所有的同语和其他符号，以未开化的心灵面对世界，你会 
做什么？没有身体的支撑，你可能什么都做不了。不过，生存的必要性毋须多 
谈，而且，心灵的最初行为就是区分能吃的和不能吃的，接着是区分冷热和敌 
我。这就离“食物”、“庇护所”和“温暖”这类概念的形成不远了 ，也离 用词语 
或言辞来符号化这些概念不远了。这样就粗陋地出现了语言这个工具。对真 
正有用的概念和范畴的探索已经起步了。语言就是大量概念的集合，这些概 
念包括事物、感受以及观念的名称，它们是人们在彼此互动和与环境的互动中 
产生或习得的。 

有些概念和分类可能不是很有用。只用一个名称来概念化所有的植物， 
就会阻碍对可食用的、有药用价值的以及有毒的植物的深人区分。有些概念 
与经验的关系太含 糊：英 语中只有一个词语表达“爱，，这种外延广泛而复杂的 
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情感，而希腊语中却有三个概念 : eix > s 表示浪漫的情爱， agape 表示一般化的慈 
爱感情， filios 表达的则是家庭之爱。英语在处理爱这个概念上的不足，通过 
该词语在我们文化中的不便运用，影响到每个人的经验。 

注意，现实检验正好构成了事物命名过程，它是存在物最基本的事务。环 
境刺激与心灵沉思之间的这种互动，构成了我们试图掌握以用于分析的那类 
思维。 

数千年后，我们仍然要面对一个事实 ：命名 是一个困难的过程。本质上， 
语言源于约定。例如，家庭（部落、民族、国家和世界）中的你、我和其他成员 
约定，把天空中闪烁的东西称为星星。遗憾的是，这些约定可能不是很精确。 
就通常的用法来看，词语“星星”涵盖大爾:的对象，有大有小、有热有冷、有固 
态也有气态。 

用精确的名字称呼事物，是理解的开始，因为它是心灵把握现实及其众多 
关系的关键。认为生病是由于糟糕的梢神状态引起，还是由于放纵时被细菌 
感染所致，其中有 欺大的 区别。“细尚”这个概念依附于一个概念系统，后者 
又关联到一个有效的治疗体系，即抗生学。 

即便草率一点，要把捤语言的意义，也是一个深奥、微妙的过程。例如， 
“种族”这个抽象的概念表达的是团体身份的差异。当赋予种族范畴或属性 
以名称时，命名的问题、影响力和困难性就显而易见了。研究者经常采用简单 
的种族分类，用“白人”和“非白人"（或“盎格杵的”和“非盎格袢的”）来给人 
命名。这种划分尽管是通行的做法，但抹杀 了世上 大部分人之间的区别。此 
外，名称本身也能引起复杂的问题。想想在美国有各式各样的名字用于指称 
美洲黑人（黑鬼、美洲黑人、有色人种、黑人）或美箱西班牙人（拉丁美洲人、拉 
丁美洲女性、美籍西班牙人、有色人种、拉丁美洲人、甩西哥美洲人、中美洲人、 
波多黎各人，等等）。 

命名这个过程也能给命名人带来重大的影响力。种族这个概念的特性不 
容易被命名。此外，种族名称是对不同人的不同定位。你自己对社会科学思 
维的表达，尽管要求你要精确对待槪念，但不是要你对你的新知识在改变生 
活、社会和文明方面的功用太过自信。 

恰当命名事物的重要性，再怎么强调也不为过。17世纪的政治学家托马 
斯 • 翟布斯 （Thcmms Hobbes ) 认为，恰当命名事物对于政治秩序的建立至关重 
要，他甚至认为这是君主的一个核心职责。詹姆士国王知道个中要害，命人对 
《圣经》做一种官方权威的诠释，以平息那些在圣经文句用词的精确意义上的 
激烈争论。 

与现代关联更紧密的是下面这个例 子：乔 治 • 奥维尔 （ Geoi^e Orwell ) 在 
他的反乌托邦小说《1984》中描绘了一幅景象！一整套官僚机构投身于语言概 
念的重构中，以此提升极权主义社会的影响力。克林顿总统曾试图通过重新 
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定义自愿成年男女间的性关系这一概念，来消除有关他与莫妮卡 • 莱温斯基 
(Monical Lewinsky ) 之关系的争议。这些事例旨在让你意识到，对概念意义的 
修改，可以影响到人类理解和社会控制的基础。 

然而，在你掌握科学方法、足以让你建立丰功伟绩之前，还得等段时间。 
眼下的关键是，对于科学目的来说，槪念是 ：（ 丨）尝试性的， （2) 基于共识的， 
(3) 其作用只能局限于把握或分离现实中的某些重要的、可定义的方面。 

概念与科学有何关系？如果你在婴儿身边呆过一阵子，你可能注意到，他 
们经常试着指向各种物体并给它们命名来显摆。尽管这个动作会重复10到 
15遍，有点烦人，但他们对这种练习感到自豪，而且这是有道理的。下一步就 
是造句了。首先是命名事物，符号化它们而不是仅仅指着它们，接着就是雒近 
现实，从而能制造他们需要的事物。安德鲁 • 赫文 （Andrew Hoover ) 的第一句 
话是对他姐姐艾黎说的。他坐在小手推车 里说： “艾黎，推推！”艾黎照做了。 

你现在看到的内容是一种努力，它试图把槪念联结起来，以拓展你的理 
解。人们说成千1：万的话，只是为了使现实做出某种有益的回应。大多数人 
不像安 德杵那 么幸运，第一次开门说话就能产生效果通常而言，概念容易混 
浓，关联也很模糊或不可祺，更不用说讲话人可能不浒楚听者的理解力和动机 
这个问题了。 

通过联结槪念，思维和理论得以发 M 。 考虑一下皮尔 • 普料东 （Pierre 
Proudhon ) 的名言“财产就是偷窃！ ”。作为一个概念，财产表示一种观念 ••个人 
可以声称土地或其他资源为他所独占。当然.偷窃意味荇不正当地捎取某物。 
普捋东用动词“是”把两个概念联结起来，旨在传达这样的一个 信息： 私人财 
产制度等于否认人类对自然资源的共同所有权。他认为，私人专有财产是不 
正当的偷窃行为。尽竹普扑东是从哲学的高度揭示了两个概念的关联，但那 
句 M 朴实无华的话就可以实现相同的功能。 

科学是一种方法，通过参考可观察的现象来检验槪念的表达以及它们之 
间的可能关联。我们下一步就来看看科学家是如何把槪念转变为可观察之物 
的。当概念被定义为变《时，就能用于构造一类特殊的语句，即假说。 

何为变量 

变最是一物之名，能对其他某物的一种具体状态施加影响，或者是被后者 
影响。热量和压力都是可以使水沸腾的变童。年龄在投票中是一个较为重要 
的变童，不过，还有许多其他更加重要的变 M : 社会经济地位、父母的影响力、 
种族、性别、居住地，等等。 

此外，变 M 还是一类特殊的概念，其中蕴含着对程度或差异度的看法。温 
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度就是一个比较容易理解的例子，它包含了对热 M 多少的看法，也就是说，对 
程度的看法。顾名思义，变： W : 指称的是变化着的事物。社会科学感兴趣的焦 
点是那些牵涉变化的概念，是探讨一个现象的变化何以能说明另一现象的 
变化。 

举个例子，考虑一下宗教与投票的关系。首先，宗教不同于温度这样的变 
Mo 尽管可能存在“虔诚”度这回事，力但我们很可能是根据宗教派别来谈论 
宗教这个概念中所包含的变化。人们认同的宗教存在着实质的变化。例如， 
在2_年总统大选时，发布的民意调査数据被用于评估宗教在选举中的重要 
性，调査显示，民主党总统候选人阿尔 • 戈尔 （ A 1 Gore ) 以 48. 4%的支持率超 
过了共和党乔治 • 布什 （George W . Bush ) 的 47. 9%和绿党候选人拉尔夫•纳 
德 （Ralph Nader ) 的 2. 7%。布什贏得了选举团的投票，在佛罗里达最高法院 
终止引起争议的重新计票后，他当选了总统。《洛杉矶时报》收集的数据显 
示，锒幣有80%的犹太选民支持戈尔（对比而言，布什为17%，纳德为1% ) ， 
而63%的新教徙投给了布什（相比之下，戈尔为34%，纳德为2% ) 。52%的 
天主教徒投给了布什，而只有 4 5%投给戈尔。“其他”宗教的信仰者以及声称 
自己无宗教偏向的人中，大多数把票投给了戈尔。②诸如这样的数据有助于 
我们 对变揿 宗教与变 M 投票行为之间的关系做出有意义的评价。 

尽竹大多数变畎处理的是程度的差异，如温度的差别，或处理多样性的差 
异，比如宗教，但有些变 fit 更加简单，它们处理的是摄基本的变化 ：在场 或不在 
场、有或没有、存在或不存在。例如怀孕，不存在多少的问题。要么有，要么 
没有。 

把概念转换成变 W , 尽管看上去似乎枯燥无味，却是一个极褚创造性的过 
程，而且经常引起有趣的问题。举个例子，考虑一下“时间”这个普通的变 M 。 
早期希腊人为槪念化这个变 BtlW 绞尽脑汁。似乎显而易见的是，时间应该有 
个开端，因此哲学家力图推算出开端起于何时。然而总是跑出一个困惑的问 
题：在 这之前发生了什么？ 

柏拉图和亚里士多德都曾有过这样的念头 ：时间 可能根本不是线性的，也 
就是说，它可能没有开端，没有前进，也可能没有终点。它可能是周期性的！ 
对于习惯线性时间观念的我们来说，这种看法似乎很疯狂，但他们两人想的 
是，宇宙时间可能有点像生理周期——在自然界随处可见的规则变化。因此， 


① 根据上教堂的频率这样的态度和行为表现，人们进行了各种尝试来测置个人的“虔诚” 
度。 例如，见 Lyman A . Kellstedt & Mark A . Noll , “ Religion , Voting for President and Party 
Identification , 1948-1984 Religion and American Politics : From the Coloninl Period to the 1980 s , 
ed . Mark A . Noll ( Oxford , England ： Oxford University Press , 1990)， p . 347 0 

② CNN . com 2000 年选举报告。 “Exit Polls . ** http :// www . cnn . com / election /2000/ results / 
index , epolls . html ,2002 年 12 月 2 日。 
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我们最好是把历时的时间看做是事件的演变结构，事件在其中依次发生，直到 
整个模式的结束，然后开始下一轮的 循环。 亚里士多德评论说，他自己很可能 
“生活在特洛伊城陷落之前，也在陷落之后，因为，当命运的车轮开始另一轮 
循环时，特洛伊战争将会重演，而特洛伊城会再次陷落。 

刚人门的学生在从事社会科学研究时，很少卷人这类烦心的概念问题，但 
并不能假装这些问题不存在。例如，变最“人格”，据说在专业文献中有四百 
多种定义，部分是因为人格是一个复合变贵，包含大量其他的变瓰：阶级、地 
位、自我概念、种族、社会化，等等。人格这一变量的复杂性迫使社会科学家采 
用了这样一个尴尬的 定义： “人们在后天习得的、相对稳定但又变动的、心理 
和社会行为倾向的独特系统 。”® 

即便社会科学家都认同对某 个变贵 的表述，也不意味着该定义是永恒的 
真理，而只是意味宥，谨愤思考过它的一些人都认为，这个定义似乎有助于回 
答某些问题。此外，研究者常常为了方便而决定采纳对某个变研的一种定义。 
在美国，按照惯例，党派认同是通过人们对调查问题的回答来测 M 的，这些回 
答把选民贤于一个连续统中 ，显示 选民对于两个主要政党的认同度。该连续 
统包含7个 类别： 

—强民主党人士一弱民主党人士一偏民主党的无党派人士一 
无党派人士一偏共和党的无党派人士一弱共和党人士一强共和党人士— 


这里假定政治无党派人士居于政治连续统的中心。但貫•实悄况可能是，许多 
“无党派人士”认为自己是激进分子，并不处在中心。有些人可能完全无党派 
倾向或不关心政治，因此他们认为自己压根就不应该用政党来归类。另外，某 
些“有偏向的”无党派人士从投票行为来看，与“弱”党人几乎一样有党派性。⑤ 
尽符对变 W 的这一定义不可能完美地反映党性这个概念背后的实悄，但它仍 
有预测力。相关问题已被调査了数十年，因此研究者可以评估一段时间内在 
党性问题上的趋势。由于在这个连续统上对无党派人士进行范畴化，其困难 
已经变得明显，因此出现了对党性的新定义。我们应该详细地阐述如何把概 
念转换成变忽视这个问题是掩耳盗铃的做法，只会使我们深陷语言的泥沼 
之中。 


③ Stephen Toulmin & June Goodfield f The Discovery of Time ( New York : Harper and Row f 
1965), p.46. 

④ Gordon DiRenzo, Personality and Politics ( Garden City, N. Y. : Anchor Books, 1974), 

p. 16. 

⑤ William Flanigan & Nancy Zingale, Political Behavior of the American Electorate y lOlh ed. 
(Washington, D. C. : Congressional Quarterly Press, 2002) , pp. 85-87. 这些作者指出，随着越来越 
多的无党派人士甚至不敢自称独立，美国选民正变得“更为中立，但并非都变得更加独立”。 
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语言中库存了丰富的概念，为我们联结变量来解释事件提供了大量的可 
能性。数百年来，人们一直手忙脚乱地梳理有意义的关联。科学是一种稍微 
高级的处理形式，它试验这些关联，尽可能仔细地检验它们。在医学中，人们 
花了几个世纪才分离出许多影响疾病的变童。直到最近医学才成为一门成熟 
的学科，能利用极为有效的血液化学分析来诊断许多疾病。这种发展反映了 
其成熟经历了一个漫长的过程，其中要分离和消除大量不重要的或不那么重 
要的变 M 。 西医越来越多地接触到一种在中国被发展成具有很高艺术造诣的 
古老医学体系，所以现在我们的医学家们力图弄清针灸为什么可以治病。我 
们必须考虑一套全新的变 M ， 建立新的槪念关联，克服习以为常的理解所造成 
的阻力。 

遗憾的是，就社会科学来看，我们很少弄清该如何奠定理论结构的基础来 
解释社会行为。许多社会科学的新生看不出——尤其在面对厚厚的入门课程 
教材时，社会理解所取得的成就背后蕴藏猗的努力与成绩、尝试和可能。 

目前，社会科学包含许多分支 （ 例如，政治学、社会学、经济学、心理学、教 
育学），所有这些学科都在忙于定义、观察和关联行为子系统中的特殊变 M 。 
社会科学家正在探索大 W 可能 的变试 关联。正在出现的各种已被检验的零碎 
知识，等待符跨越这些探索界线的幣合。由于我们迫切需要全面的社会理解， 
因此这些努力必定会越来越多，但有关尝试还相对较少。 

量化和 测量： 转概念为变量 

我们在前面提过，社会科学家把概念转换为变这样做是为了用一种 
可观察的形式把槪念表达出来，使之包含对程度或差异的某种看法。接下来 
的问题 是：如 何确定程度或差异？答案分为两个 步骤： W 化和测敢。 

敢化的观念意味着为某个事物设定标准虽，并贴上标记。用这种方式表 
达抽象的概念（如长度），有可能为观察提供共同的参考。有些世化的起源相 
当奇怪。例如，古希腊人笛要一种衡量距离的标准，他们就以赫拉克勒斯的足 
长为长度标准。这只足与腕尺竞争长度标准，后者是某个人的前臂长。腕尺 
的问题是，人们根本不可能就标准的前臂长度达成一致——有人说是17英 
寸，有人却说是21英寸。结果，人们再没谈到腕尺这个长度标准。 

分离标准化的单位，有助于描述和分析。当加布里埃尔 • 华伦海特 
(Gabriel Fahrenheit ) 形成了 温度高低的观念后，他就能对热和冷做更有用的 
描述。如果水温是32度而不是33度，其中就存在巨大的 差别； 而词语“冷”和 
“更冷”是没办法很好地把握那一重大差别的。 

在社会科学中量化有两种 形式： 不连续的和连续的。不连续 M 化包括计 
算事物的在场与不在场，也包括计算 M 性的差异，其前提是差异以范畴形式出 
现。投票支持某候选人是不连续的、特殊的行为，可以用常规的方式计算。个 
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体的性别是一种属性，可以算做是男性或女性。 

不过，有些贵化必须把握连续变异的观念。年龄是一个连续量化的例子。 
我们确实可以用年数计算人的年龄，但年龄的 M 化，表达的是演化着的东西。 
今天，本书的一位作者是 62.29 岁，明年 9 月他将 63 岁。连续量化处理的不 
是离散的事项，而是处理年龄、长度和时间这样的纬度。连续量化的标志是， 
有关变 ffi ： 可能在一数值范围内取任何值，而在不连续贵化中，只能出现整数值 
(如计算羊的数目）。 

每个变最 的凿化 都有其独特的问题和潜能。成熟科学的显著特点之一是 
有一系列可 M 化的变贵，能为有关领域的工作人员提供帮助。有天赋的科学 
家的一个特征是，他们有能力找到方法，以一种可靠的和有意义的方式傲化那 
些® 要的变姐。经济学用金钱作为分析单位，走过了漫长历史（虽然除了其 
他人，甚至经济学家有时也会混淆金钱和价值）。许多有效的经济指标，如国 
内生产总值或消费价格指数，都建基在金钱之上。 

遗憾的是，其他的社会科学没有这么容易 W 化的单位，来测撖权力或表征 
心理压力、异化、幸福、个人安全，还有价值。不过，有创造力的科学家找到了 
一些多少有效的方法，把捤到这些变 M 的一些可械化的方面。这些领域里的 
任何一本教科书中都包含数十种例证，表明如何把概念转换成可揪化的 变世， 
我们在下一章做一些介绍。 W 化的重要性在于，一旦能够被 W 化，我们就有可 
能做更梢确的测 ’ 

测缺不是我们能选择的班，它内在于各种分析性的讨论中。如果你持怀 
疑的话，那在下次交谈的时候聚精会神地听听，肴濟你对那些包含测坩要家的 
词语的依赖性。“民主党人一般偏向穷人”，这样一个简单的政治陈述都包含 
三种测敞。 动词“ 偏向”怠味着程度上的差异，“穷人”一词也是如此，“民主党 
人”是一种分类。修饰词“一般”试图限定这种测 M , 指出这并不是所有民主 
党人的一个普遍特征。 

如果数馱能被确定，测放就会容易得多。 M 明 M 的测斌处理的是多少的 
问题： 有多远、多少钱，等等。有些牵涉到多少的问题不大容易测遺，比如民 
意。在把对问题的回答当做可量化的分析单位时，粗糙的凋査方法给回答者 
提供的只是“被迫选择”，把意见分为赞成或反对。在这里，意见是作为不连 
续的'绝对的变 ffl 被量化 的：“ 你是赞成还是反对？••民意调査通常是以此为基 
础的。这么简单的测量无疑会掩盖民意的强烈程度。在许多政治问题上，可 
能有少数人在一种立场上持强烈的态度，而多数人不冷不热地持另一种立场。 
一呰民意调査在处理这种情况时，使用了四个范畴而不是 两个： 

强烈支持支持反对强烈反对 

只以多数人的情感作为行动基础而不考虑强烈程度的政治体系，会给自 
身带来许多麻烦，就如美国在越南战争时的做法一样。态度强烈的少数反对 
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表 2. 丨对总统和副总统候选人的感受的澜置,2000 



平均评级 

评级为“50” 

的百分比 

无法归类 

的百分比 

A 1 Gore , M 阿尔•戈尔） 

57 

15 

2 

George W . Bush (乔治 • W • 布什） 

56 

18 

3 

John McCain (乔•麦坎） 

60 

25 

21 

Dick Cheney (迪克 • 程泥） 

56 

28 

24 

Ralph Nader (雷普•纳 德） 

52 

30 

27 

Joseph Lieberman (约瑟 夫 • 利普曼） 

57 

28 

27 

Pat Buchanan (帕特•布 坎南〉 

39 

31 

18 

Bill Bradley ( 比尔. 巴拉迪） 

55 

34 

28 


来 脒：作 荇根据原始数 据杓案 （2000 American National Election Smdy> 的计算结果。原始数据见 


hllp ： //www. umich. miu/ ^ n«c/. 

者变得怨恨和孤立，因为决策者的决策取决于较为冷静的多数支持者。过了 
几年，少数派变成多数派，才有能力改变政策。 

测《偏好的强度，更有创怠的方式是用程度来测 W ： 意见。有些_査让人 
们用“悄感温度计”上的刻度来评估候选人或政党山代表否定，50代表态度 
中立， KX ) 代表#定。这有助于扩大回答的范围，更精确地显示意见的强烈程 
度，但它仍可能掩盏大址信息，有些人 尽赀确 实没什么意见，但仍可能对问题 
做出间答。⑥ 

考虑一下民众对竞选2000年总统的候选人有关的“情感温度计”调査问 
题所做的冋答。如表 2.1 所示，对候选人持中立态度的人的比例，似乎与确实 
听说过该候选人的比例有关。相对不知名的候选人帕特 • 布坎南和霜普•纳 
德，得到“50” 的评分远多于广为人知的候选人布什和戈尔。这就使一些人怀 
疑，这个问题能否有效地测 fi 人们对不太熟悉的候选人的中立“悄感”，或者 
能否有效地测 M “无态度”或其他态度。 

变量的可靠性和有效性 

相较于含混语句中的模糊用词来说，恰当构想和实施的变 化测擞 ，能 
更有效地详细表明差异和程度。不管我们决定怎么测最变最，都希望找到一 
种计算方法，即便其他的研究者使用，也能产生可靠的结果。 

例如，我们决定问一些随机抽样出的回答者，他们是“喜欢”还是“讨厌” 
总统（因此是二择一的强迫选择），以此测量“总统的民意支持”。我们可以预 
期，其他的凋査者在下一天使用相同的测 M 方法，问数 M 相当的随机样本，将 


⑥对“无态度”问题的讨论，见 Herbert Asher ，Polling and the Public : Whal Every Citizen 
Should Know , 4 th ed . ( Washington , DC ： Congressional Quarterly Press ，1998) , chapter 2 。 
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产生相似的结果。 

反之，我们可以问一辆公共汽车上遇到的前4个人，他们对总统“有何看 
法”，然后通过对他们回答的个人印象来评估总统的民意支持。而其他人来 
曰在同一辆公共汽车上采用相同的测 a 方法，可能产生完全不同的结果。答 
案可能是含糊的，而影响到答案解释的价值观可能也有差异。 

如果不同的人对变量的测 a 产生相同的结果，那么这种测量通常就被说 
成是可靠的。强迫选择式的问题很可能产生一致的结果，因为使用相当样本 
m 的每位调査者必须计算“喜欢”和“不喜欢”的人数，来测銳民意支持。然 
而，与公共汽车上的人进行开放式的讨论，箝要调査者解 释耐能 （或可能不） 
反映民意支持的各种评论。这类回答是有意义的，甚至就某些方面而言，比强 
迫回答更有意义。但是它们不大可能就总统声望这个问题提供一个可辟•的 
答案。 

理论上对变《测贵方法的关注可以做到很细腻。我们使用的每种 测撤方 
法，都被假定很好地反映了一个世化的变燉背后蕴含的抽象概念的真实悄况。 
如果一种测馉方法“做到该做的”，⑦就是有效的。一种欺化的测租方法越能 
反映研究关注的底层槪念的定义，它就越有效。社会科学的困难之一是，从来 
就没有明确的方法用于直接评估有效性。举例来说，智商测试是许多试图歌 
化智力的调杏者使用的或许可依的测粞方法。但是，这种测试对于测揪锊力 
这么一个丰富的、变化多端的、有影响力的概念，能达到多大程度的梢确性，永 
远是一个有争议的问题。枰商测试可能可棋，但是否绝对有效？ 

构想不当的测世是危险的，正是因为它能带来太大的影响。一个不幸的、 
令人反感的例子是，“尸体计数”在美国当做关键手段，用于“推进”它在越战 
上的努力。战争的新闻广播报道通常是军亊数字，说每天有多少“敌人”被打 
死。言下之意是，打死的敌人越多，就能越快贏得胜利。这种铍化的测玢有两 
个错误。 

第一，它并没有测 M 某些决策者宣称它已测 M 的东西 ：在实 现战争的总体 
目标中胜利或失败的数摄。由于战争不只是军事冲突，它至少还是一场政治 
和心理较 M :， 尸体计数在很大程度上不能作为胜利的一项指标。它们或许能 
让军方知悉一些敌情，但这种方式会在越南人民和美国人民那里产生不利的 
政治和心理影响。越南人民开始注意到，无论这场战争为何，被美国打死的主 
要是与自己同种同国的人。因此，许多越南人开始畏惧美国人，而不是把他们 
当做盟友来欢迎。与此同时，美国人民也开始把自己看成是给一个贫穷国家 
带来灾难的行尸走肉的战士。 


⑦ Edward G . Carmines & Richard Zeller ，Reliability and Validity Assessment. Sage University 
Paper Series on Quaniilative Applications in the Social Sciences , no . 17 ( Beverly Hills ， CA . : Sage 
Publications t 1979). 
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测量中的第二个错误是它的执行。据说野战部队要计算并报告敌人的死 
亡数目。然而出现了几个因索 ：认定 敌人上的混淆（有时是故意的），在同一 
个地点有两个以上的人计数所造成的错误，指挥系统对高尸体计数的要求带 
来的压力。因此，尽管尸体计数不断上涨，并导致对战争胜利的预测，但实际 
情况却恶化了。⑧ 

有一点非常重要 ：草率 的或不当的测 M ， 一般比不测 M 还糟糕。对测 M 结 
果的解释需要 对测* 本身有所理解。第5章将探讨测最实施和测最解释过程 
中的实践步骤。 


假说 


尽管前面的许多讨论，看起来像是对零零星星的科学思维做系列回顾，但 
对假说的讨论可以把这些题材组合到一块。 

假说是一种特殊建造的句子。假说的目的是组织研究。如果假说得到了 
精心设计，科学方法的所有步骤也就随之而来，如项目大纲、参考书目、所黹资 
源以及适用于研究的测 M 方法的说明。假说提供了幣个的结构。 

假说提出的是两个或吏多变 ift 间的一种关系。例如 ：政治 参与随教疗增 
多而增加。这个简单的断言也可肴做是一条假说。它有一个主项（变 世：政 
治参与），一个连接动词（一种 关系： 增加），以及一个宾语 （变 Irt : 教 育）。 

我们再看两个 例子： 

异化随贫穷加剧而增加。 

工会成员比非工会成员更有可能投民主党候选人的票。 

或者，不那么明显的例子（你可以为练习而从中找出变世及关系）： 

距离产生美。 

每天一苹果，不用上诊所。 

早睡早起，健康、富裕和聪明伴随你。 

至关重要的是要认识到，假说其实是一种假定，正如牛津英语词典指出 
的：“ 作为深人研究的起点，并被证实或证伪……”假说靠近研究的起点而非 
终点，尽管优秀的研究可能会提示富有成效的新研究途径和新假说。 

到目前为止，我们关于假说的大部分例子都是相当简单的。从简到繁，我 
们来引用一次教导科学思维的经验。有名学生来见一位笔者，他带着下述研 


⑧在1991年的波斯湾战争期间，盟军军事指挥部为避免这些问题，没有公布对伊拉克军 
队估算的伤亡数。 
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究 提案： 


殖民者与殖民地居民之间的不稳定关系（形象地说，类似于连体双 
胞胎的关系），以及他们分别与殖民状况的互动，导致了脆弱的双螺旋型 
心理病态的发生，它对心理颇有影响，其结果导致心理失调，即各种神经 
官能症，它们随即确定了殖民地的政治细节的本质。 

这仅仅只是提案的开始！在所有这些混乱的语言中，存在很多变 fa •和关 
系。不过，梳理后可以得到两条 假说： 


碴民主义关系到殖民者和 碴民 地居民的神经官能症行为。 

这种神经官能症行为影响到埴民主义的政治结构。 

这两条假说尽管很大，但尚可 处理。 殖民主义这个概念描述了一种定型 
的政治格局。“关系到”这种关系不像“导致”那么口气强硬——这只是因为 
学生能获得的研究资源有限，因此要滿愤点。神经官能症行为也是一个棘手 
的概念，但出自于心理分析理论文献，有些行为确实还能贴上神经官能症的标 
签。这样一来， M 正的工作就是表明，在殖民条件下发生的各种神经官能症 
的、自毁的行为，关系到殖民政治的压迫与独栽模式。 

如果这位学生通过证据搜集 、测畎 和评估，完成了这些假说所涵盖的工 
作，那么他就可 以申济 博士学位了。不过大家都知道他谈的是皮毛，他的论文 
(居然胆敢命题为《殖民 主义： 神经官能症游戏》）最多也只能说是达到大学生 
的要求。 

这个例子表明了一点，在形成假说之前，往往存在一个先行步骤，称为问 
题 重构。 在上例中，我们是从对殖民主义和神经官能症的一般性关注 着手。 
那名学生在闹述这一关注时使之复杂化。而我们通过厘浒变袱和关系，把它 
简化，使之能得到处理，至少能用一般的方式来处理。采用一种可行的重构 
后，要定义变 M 的表征方式，就变得比较容易了。 

社会科学的艺术之一，就是有技巧的问题重构。 除了一 些分析常识外，重 
构还需要一种能力，能看出环境中的变褚和变贵间的可能关系。 第一 步最好 
是把问题分解成作为其构成郎分的变量和关系。写下与问题有关的系列假 
说，这样就能从中挑选出可以回答下述两个疑问的 假说： 对于解决整个问题而 
言，哪些假说至关重要？就你所掌握的资源范围来看，哪些假说有信息 支持？ 
有时候，这些问题会迫使我们做出一些不愉快的选择，但可以防止研究工作还 
没有什么实质性的结论就结束了。上面关于殖民主义和神经官能症的例子， 
就清楚地表明了这一点。 

在启动研究任务前，恰当地提出一条假说，其重要性再怎么高估也不 
为过。 

下述原则会对你有所 帮助： 
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1. 变量必须得到明确说明，并能用你掌握的技术加以测量。 

2. 变量间的关系必须得到精确陈述，而且必须是可测量的。 

3. 假说应当是可检验的，这样，表明关系的那些证据才能被观察、证 
明或证伪。 

如果不遵循这些规则，假说可能是行不通的、荒唐的，或是在现有资源下 
无法研究的。简而言之，对测最的精确定义和详尽说明是关键。谨慎构造假 
说的努力或许没什么乐趣可言，但在这个过程中出现的问题迟早要予以回答。 

因此，假说提供了整个研究工作的结构，无论该工作是访谈凋査，还是分 
析以前收集的数据，抑或是文献研究，或三者兼具。假说将把你直接引向相关 
的资料，避免你做无用功。利用图书馆的搜索引擎、互联网、图书索引、期刊网 
上导读服务，以及只读光盘/电脑数据库检索，你可以对你选择的变嫌加以研 
究。变最之间所设定的关系，指示了你需要使用的测撖工具和评价标准。假 
说的检验结果就是你的真正结论。 

一旦通过构造和检验假说，建立了变世间的关系，这些关系就能表达为概 
推。以得到检验的关系为基础的槪推，就是科学的目标。概推就是得到检验 
证实的假说。 随荇某 一研究领域中概推的积累，它们就构成了理论的原始材 
料。不过谈这还为时过早。现在，我们窬要看符科学方法如何把研究程序变 
成一种逻辑秩序。 


科学方法 

科学方法这种技术其实很平常。模型研究有一些步骤，其中 包括： 

1. 鉴别需要研究的变量。 

2•提出有关变量关系或变量与环境关系的假说。 

3. 现实检验，以测量变量中的变化，从而观察被假设的关系是否受证据 
支持。 

4. 评估 ：把变 量间被測量的关系与初始假说进行 比较； 提出有关发现的概 
推（关系）。 

5. 就有关发现的理论意义、检验中可能歪曲结果的有关因素，以及研究可 
能引出的其他假说提出建议。 

尽管我们在这里已经勾勒出科学方法的骨架，但实际研究程序并非总是 
直接起始于假说的构造。在陈述假说之前，社会科学家通常会检查某一领域 
中所收集到的资料，以便观察变 ft 之间是否存在关联。各种统计程序所揭示 
的关系通常能提供线索，指出一些很有探索价值的假说。有时候，只是翻翻一 
些资料，就能促发一个精彩的思想 、一 次偶然的洞见或一种全新的观念。过去 
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数十年来已积累大 M ： 的资料，所以研究者在做每项研究时，通常用不着白手起 
家。现有资料的分析在鉴别那些需要用于检验关键关系的新资料方面极为 
有用。 

这也仅仅是科学方法的轮廊。熟练的分析者还会引人其他的元素，比 如： 
测 ffl 结果时对转换法 ( alternative forms ) 的使用、对变量描述的详细概念分析、 
自己的研究与其他研究之间的关系、对测 M 工具有效性的评估、实验组和控制 
组的使用，此外还同等重要的是，对已检验之外的东西做出谨慎地猜测。不 
过，方法论上的这些装饰，更紧密地关涉到实施方法时使用的工具，而非方法 
本身。 

要点是，科 学方法是利用可观察的证据，以一种训练有素的方式来检验思 
维，并且在该过程的每一步都做到明晰。 

考虑下述两类研究的差别：（1)—项经验性的科学研 究：研 究者陈述其价 
值，构造假说，设计检验程序，仔细选择和讨论测敢方法，产生一种特定的结 
果，并把该结果与假说关联 起来； （2) —项非科学的 研究： 研究者表达其价值， 
提出一般性的论题，考察相关的例子，并陈述结论。 

注 意：两 项研究中都存在思维和调査之间的张力。但一个重要的区别是， 
第一•项研究可以*鉍，能对结论的有效性进行检验，而第二项不行。社会科学 
家川览制这个词表达一种 能力： 研究能被重复，以检验其有效性。复制构成了 
对优秀研究的强检验，因为它能揭潘出研究程序中不知不觉渗进的一些错误 
和主要研究中包含的评论性判断。 

非科学研究的第二个困难在于，它在把两项研究关联起来时存在狩问题。 
你 W 在一次讨论中因别人要求你“定义你的用语”而感到苦恼吗？你曾陷人 
一场以“你怎么知道它是正确的”为结尾的争 论吗？ 

要弄淸楚所发生的现象需要一些信息，好的科学研究就能提供所有这类 
信息。例如，如果采用标准的变 ffi ： 定义，而且我们就选举人对候选人的评价做 
了一项研究，那么该研究就可以被吸收进其他的 研究： 如选举人如何看待有关 
问题、政党，等等。随着科学家努力构筑积累性的知识体系，使用不同测域方 
法对同一变量所做的不同研究就能得到比较，看看测攮技术是否产生一些不 
同的结果。同样，要点在于 ：科学 调节、阐明思维与调査之间的关系，并能^其 
他人确切地知道该项研究做了什么。 


理论的多种角色 


科学的权威源于它坚实的基 础：关 于“现实”的可观察证据。有时候我们 
就是把科学描绘成现实检验。由于每个人都认为自己清楚什么是现实，所以 
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科学有根本的号召力。然而，科学中实在论的必然搭档是一种完全想象性的 
现象： 理论。如果没有理论所扮演的多重角色，就不会有科学（另外，还有人 
会争论说，同样也不会有可以理解的“现实”）。 

正如语言产生于满足人类需要的经验，理论也源自于人类所面临的任务。 
最艰巨的任务是说明究竟是怎么回事。关于理论是什么，不是什么，已经有大 
馈著作。对于我们来说，理论就是一套互相关联的命题，为事件的发生方式提 
供说明。 

构成理论的命题与假说一样，具有相同的形式 ：它们 都是由概念以及概念 
间的联接或关系构成。一旦假说得到检验，出现了新关系，理论就构筑起 
来了。 

敁平 常的日常事务是生产理论的沃土。从自动贩卖机付款到基尔博特动 
画片的深层含义，都有相关的理论。 M 宏大的理论是宗教和哲学，它们关注各 
种各样的大问 题：宇 宙起源、物种历史、生活目的、导向美德的行为规范，或许 
还有幸福。对于忠实的信徙来说，这些理论的“真”取决于对超自然现象的信 
念。这类理论在提出时，就好像它们深梢于我们的生存这个更广阔的宇宙中， 
舴待我们的理解。 

相反，社会科学对理论持一种不同的符法。社会科学家扱常见的态度是 
实用主义的••只有在说明观察时理论具备当下的或潜在的用途，才说得上好。 
任何科学的要旨都在于提出一套理论来说明其观察范围内的 事件。 

认为理论就是变动不居的日常经验背后静止不变的东西，这是一种很有 
吸引力的想法，但是是误导人的。节实上，理论是人们在追求理解时偶然的天 
才性创造。人类根据滿要创造理论，而这些理论又能反作用于那些®要，对之 
产生有利或不利的影响。一个理论可能包含一套完整的范畴和概推——但可 
能还是没什么作用。例如，假如有个人把世界分为高的物体和矮的物体，并把 
它们之间的所有关系都做了刻画，一个理论就诞生了，但它的效用是可疑 
的——不是错误，而是没用。 

社会科学的理论通常源于一些关于人类行为的基本假定。理性行动者理 
论认为，个体、组织和国家都以最大化他们的物质利益为动机。基于该理论， 
我们可以猜测，投票人选举候选入是为了增进他们自己的经济利益。然而，心 
理学理论断定，投票行为是由人们对政党的长期感情决定的。该理论认为，投 
票人被社会化，由于家庭的影响而忠于某一个特定政党。基于该理论，我们可 
以猜测，投票人的行为与其父母的行为是一致的，或者说，他们会年复一年地 
选择同一个党派。理性行动者理论、心理学理论、马克思主义理论和其他形式 
的社会理论都对战争的起源做过说明。 

我们讨论的是理论是什么，不是什么。下个问题 是:理 论可以用来做 什么？ 
答案是 ：许多 事情。我们可以列举理论在社会科学思维中的四种特殊 作用： 
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1. 理论为资料解释提供了模型。 

2. 理论把研究彼此关联起来。 

3. 理论为概念和变量配备了框架，从而使之获得实质意义。 

4. 理论使我们能向自己和他人解释我们的发现的深远意义。 

我们且通过考察投票人参与这个问题来阐述理论的这四种作用。投票人 
参与的比例是民主的一项重要指标。我们有理由预期，不同类型的选举规则 
会影响那些认为值得花时间和精力去投票的人数。我们将表明，理论会如何 
影响到我们看待对立选举规则下政治参与问题的方式。从资料中观察到的模 
型、研究之间被建立的关联、有关发现的实质含义，以及它们的深远意义，都是 
由研究者使用的理论塑造的。 

在这个例子中，我们将集中关注，选举规则是怎样把人们的选票变为政党 
的议席的。在美国，几乎所有的选举都支持“单一选区制”。这些规则为每个 
选区中获得多数选票的候选人提供一个议席。假如这些规则允许更多的政党 
获得议席（比如在比例代表制中），那么就有更多的人可能参加投票。⑨在比 
例代表制中，每个政党基于其得栗比例而在总议席中蠃得相应的议席。比如 
说，如果在一次选举中，分配丫 10个议席，那么其中大部分席位可能会落人大 
別政党的候选人手中，但如果小？ g 政党能廒得 10% ~20% 的选隳，就可以推 
举 1 〜 2 个席位的候选人。 

饤 人提岀理论说，在单一选区制下，蘇者通吃的规则可能会减少投親者的 
参与。在美国，这样的规则意味荐，儿乎所有的议席都会被民主党和共和党的 
候选人占据。其中的假说就是 ：不偏 向主要政党候选人的公民可能不愿意投 

煨。⑩由于很大一部分选民视自己为“中 立派” ，所以这就成了评估美国民主 
实效的重要因素。 

考虑一下表 2. 2中的数据。该表显示了三类选举规则下不同国家进行选 
举时投票人数的平均水平。蠃者通吃规则只把议席賦予单一选区中率先胜出 
的候选人。比例代表制一般允许投票者选择一个政党的候选人名单，然后大 
致按照每一政党的得票情况分配多数席位。有些国家采用赢者通吃规则选出 
部分席位，而其余的采用比例代表制。这些国家厲于混合体制。 


⑨ 例如，参见 G. Bingham Powell , M American Voter Turnout in Comparative Perspective, M 

American Political Science Ret^ 80 f no. 1(1986), pp. 17-43. ’ 

⑩ 有项研究试图保持文化差异不变，比较在美国采用嬴者通吃规则的局部选举时的投票 

人采用 “ 半按比例投票制 ” 时的投票人数。该研究发现， “ 半按比例代表制，，下的投票人数 
增长广 5 个百分点 。见 Shaun Bowler, David Brockinglon & Todd Donovan, 44 Election Systems and 
Voter Turnout ： Experiments in the United States." Journal of Politics , 63, no • 3 t (2001) pp 902- 
9I5 0 ’ 
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表 2. 2 20 世纪 90 年代国家选举投票情况 




议会的选举规则类型 


贏者通吃 - 

比例代表制 b 

混合型 ^ 

平均投票人数 

66.5% 

74. 3% 

77.3% 

标准差 

9.4 

11.3 

3.8 

国家数 M 

4 

3 

12 


a 加聿大、英国、法国和美国 
b 德国、日本、新西兰 

c 丹麦、芬兰 、希腊 、冰岛、爱尔兰、以色列、荷兰 . 挪成萄牙、西班牙、瑞典 、瑞士 
注: 平均参与投票数来自19个发达的 T . 业民主国家的大选，其中投犋大多出于自 〖SL 
来源:作 S •对 吩始数 据的统 i | •，数据来源 f Rus«**ll J. Dalton , Citizen Politics : Public Opinion and Political 
Parties in Admnred Irulustrial Democracies ( Challiam N. J. : Chatham Houne, 2002) , p. 36. 


这些数据传达了怎样的信息呢？先看 M 上面一行的数据，我们可以发现, 
选举规则会影响到国家选举的参与悄况。采用比例代表制的国家投票率达到 
74% ,相比之下，实行蠃者通吃规则的国家投票率只有 66 %。这些数据是不 
同国家的投眾悄况的平均值^虽然不能直接证明，但它们也暗示，比例代表制 
使史多的公民参与选举。然而，一些竞争性的解释以及干扰性的变 M , 如文化 
差异，也可以说明这些模型。⑪ 

理论在哪？什么样的理论适合这一数据模型？一种理论是说，当人们认 
为其行为会产生实质性的结果时，才更有可能去行动——在这个例子中是投 
票行为。换句话说，如果他们认为他们所支持的政党会获胜，或者认为在势均 
力敌的选举中他们的投票很重要，才 M 有可能去投票。因此，比例代表制可能 
吸引小型政党的追随者去投票，因为他们的投票更有可能影响到某个代表的 
选举。由于比例代表制使更多的政党可能获得立法席位，所以表 2. 2中的数 
据似乎更支持下述理 论：比 例代表制能调动更多的公民，因为他们的投票更有 
可能产生实质性的结果。 

另一种理论 认为： 人们投票是出于“公民义务"感。根据该理论，他们投 
票时就不会考虑他们支持的政党贏得议席的儿率。⑫由于没有数据表明公众 
的义务感在这些国家之间是如何变化的，因此，尽管我们的数据与一个理论相 


⑪ Douglas Amy， Real Choices ， New Voices. ( Cambridge, England : Cambridge University 
Press，1993 ), pp. 140-153 ； Arend Lijphart, ** Unequal Participation : Democracy' s Unresolved 
Dilemma,” American Political Science Review 91 , no. I ( 1997) ， pp. 1-14. 

⑫关于这些相争理论的讨论，见 Donald Green & Ian Shapiro， Pathologies of Rational Choice 
(New Haven, Conn,： Yale University Press. 1994). Cf. Kristen Monroe, The Heart of 
Altruism : Perceptions of a Common Humanity ( Princeton f N. J. : Princeton University Press • 1996) 0 
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吻合，但该事实并不意味着我们就能否认另一个和它相竞争的理论。 

留意不同的理论，能使社会科学家把其研究同先行的研究关联起来 。它 
还提供一种方法，制造额外的检验，从而使我们可能拒斥那些为数据模型提供 
其他说明的竞争性理论。例如，如果我们发现“公民义务 ，，在 表 2. 2的数据所 
反映的地方没什么差别，那么我们就有更强的理由认为，比例代表制比贏者通 
吃更能调动人们去投票。 

与投票所付出的代价相比，比例代表制可能带来更多实质的好处 （代表 
的更大机会）。情况有可能是，在美国，不投票的人感到在政治上被边缘化 
厂，因为选举制度阻止了他们支持的候选人获胜。利用推理中的这些关联，社 
会科学家就能积累有关不同理论建构之关系的知识。至此，我们联系表 2. 2 
中的实例看出了理论的两种作用 ••理 论提供的模型，以及理论把一项研究同另 
—项研究关联起来的方式。 

现在，理论的第三种作用就显 而易 见了。在这里，我们需要评估观察的实 
质怠义。奶也就是说，我们需要追问，观察是否有一些精彩的、重要的离意 
对十检验“理性行动”理论在说明政治行为方面的效用，这个结果可能很重 

要。就这个例子来说，我们可以推断，在一个采用廠者通吃的国家，改用比例 
代表制能提高10个百分点的投票率。⑭ 

枵来，选举中给公民越多的选择，参与的人可能就越多。这就引起了 —系 
列有趣的、实质性的 问题: 这些投票者的参与将如何改变政治体制？什么样的 
新政党可能获胜？类似于国会这样的机构如何应对几个政党？ 

对丁把 政治机构与人类行为联系起来的理论来说，这些发现的深远意义 
超越了那些具体的实质性问题。代表民主制的参与，不仅仅是有形式上的投 
漯权，人们同样对该过程的结果和有关制度产生的限制非常敏感 ^ 当然也有 
其他的因索卷人，不过，那些产生吏多社会团体代表的选举制 度似乎 也能鼓 
励史•多的人参与投票。比例代表制能产生出更广泛群众的代表 •一般 而言，这 
种制度同样可能更广泛地影响到公民对政治和政府的态度。⑮ 

⑬不应该混同于统计意义（见第5章），后者告诉我们的是，赢者通吃和比例代表制之间 
的差别是不是偶然的。实质怠义与理论相关，而非与统计槪率相关。 

⑭一些解释额外 变歎的 比较研究认为•比 例代表制对 于投票率的独立作用效果在 3% 〜 
7% 浮动。见 Andre Blais & Agnieszka Dobraynska, - Turnout in EJectoral Democracies , M European 
j0Umal ° f PolUkal Research M (1998) ， PP . 167-181 ； Andres Under & Henn Milner, ^Do Voters 
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在讨论理论的过程中，我们用实例表明了它在社会科学研究中的作用。 
大多数研究者都想证明其理论是“对的”。然而，一位颇有影响的社会科学分 
析家卡尔 • 波普尔 （KaH Popper ) 表明，科学的最佳用途通常是反驳理论，而非 
“证明” 它们： 

几乎每种理论都可以说是符合许多事实的。这也是为什么我们能 
说，只要不能找到反驳性的事实，而非不能找到支持性的事实，理论就得 
到了确证的理由之一 。⑯ 

换句话说，数据给人留下的印象，更深刻的是作为反驳理论的证据，而不 
是作为支持理论的证据。 

在对理论的讨论中，我们没有把握到的是人们在思考其观察对象时的微 
妙性和创造性。理论启发观察。然而，就像照在物体上的一束灯光一样，每种 
理论都会留下自己的影子，挑战我们的想象力。 

一方面，我们只能说，没有理论，社会科学就会沦为没有条理且奄无意义 
的一堆观察、数据和统计 数字； 另一方面，并不是所有的社会科学都限定于严 
格的、明确的理论表达。不过，绝对淸楚的是，®杂的社会问题滯要我们尽可 
能做出材料充分翔实的研究。用理沦的形式组织和评估知识，几乎与作为第 
—步的知识搜集一样 m 要。历史上到处都是构造糟糕的社会理论残骸，有时 
候产生悲剧性的结果，尽管 有些敁 伟大的文明进步归功于理论想象的能傲。 
现在我们常掘了科学思维的基本工具。但是工具本身不能完成工作。我 

们还需要一套方案，或者，就如下一往描述的，—种策略，把工具派上 用场来 
获得某种知识。 

引入的概念 


概念 （ comcept) 

变量 （variable ) 

不连续置化 （discrete quantification) 
连续量化 （continuous quantification ) 
测量 （ measurement) 

可靠性 （reliability ) 

有效性 （ validity) 


假说 （hypothesis ) 

冋题重构 (problem reformulation ) 
概推 （ generalization) 

科学方法 （scientific method ) 
复制 （replication ) 

理论 （theory ) 


⑯队 Popper Selections 9 ed. David Miller (Princeton, N. J. ： Princeton Univereity Press 
1985) ， p.437 。 
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讨论 


1. 考虑概念“失业”。 

•如何定义它，使之能作为一个变量被测量。 

•你能想到多少个“失业”的定义？ 

•这些定义有何不同？ 

2. 从可靠性和有效性的角度评价一下测量失业的不同方法。 

•就可靠性来说，如果其他研究者采用你的测量方法（变量），会产生相似的 
结果吗？ 

•从有效性来讲，这些測量方法能很好地反映“失业”这个概念吗？ 

3•考虑一下1996年大选中关于宗教和投票行为的数据。制作一个表格，反映 
这两个变量间的关系。你能就宗教与投票行为的关联方式（或为何有关联）提出 
假说吗？ 

4•社会科学家处理的更为复杂的问題之一是 ：人们 为什么要反抗他们的政府? 
考虑三次大型的革命例子 （17 世纪的英国，18世纪的法国和20世纪前叶的俄罗 
斯）。以这些例子为基础，你能提出革命发生原因的假说吗？在提出假说时，考虑 
一下： 

•革命的发生与哪些变董有关？ 

• 你如何定义如革命这样的概念？ 

• 其他的研究者能否把你的变董可靠地应用到其他发生或没发生过革命的 
国家？ 

•你假说中的变量是如何被关联在一起的？ 

* 你会怎样检验你的假说？ 

• 如果别人使用你建议的测量和检验方法，能得出和你一样的结论吗？ 




“事实就像株子，空的时候不能立起来。要让事实立起来，你得往其中加 
进使之得以存在的理性和感受。” 

- 路易吉 • 皮兰德娄 （Luigi Pirandello ) 

敏锐的读者会注意到，通常被认为是科学方法所必需的两个词，在本书里 
却很少岀现。它们就是爷实和真理。这两个词的共同之 处是： 它们都带有一 
种绝对主义的意味，误导那些狞手用科学方法来获取知识的人。从字根来狞， 
事实意 味教“ 一件已完成的事悄”。已经做完的事情是无可争议的，但问题在 
于，“已完成的事情”并不是由某个中立的全能观察者而是由人感知到的。 

人只有有限的感知能力、本能和利益结构，这都影响到他们观察世界的方 
式。科学是一个过程，尽可能使这邱感知变得明晰，并能不受限制地接受检 
验。但是我们必须始终这么看待科学程序的 结果： 它是一种努力，旨在控制一 
个过程——即便并非不可能，但也被我们的人性弄得难于完全控制的一个 
过程。 

出于工作目的，社会科学家通常把事实看做是“根据理论目的而对现实 
所做的一种特殊安排”。①任何被定义为事实的事情，都是与观察者在研究现 
象时所持的特定利益联系在一起的。跨过这一步是不会有什么作用的，因为 
哲学丛林就在前方隐现，里面蕴藏深奥的问题 ：倒下 的一棵树没被观察到，既 
然我们无法知道它确实倒下了，那么它究竟倒下没？ 

对哲学家来说，真理这个词就像块牛肉，大受他们的欢迎。科学更倾向于 
在不那么高贵的领域里工作，这个领域由一些可证伪的陈述构成，它们能得到 
其他人的检验。对好的科学命题或概推的陈述，要能让随后的观察提供支持 
性的证据，或是提供质疑该命题精确性的证据。如果把证实程度作为科学的 


① David Easton, The Political System (New York ： Knopf, 1953) , p. 53. 
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—个持久考虑，就可以避 免大童 草率的结论。 

对事实和真理所持的这种不明朗的态度，有人对它的反应可能是 追问： 
“那么，我们究竟要相信什么？”如果你想要绝对可信的东西，那必定要到科学 
以外的领域去找。科学是一种工作程序，利用对经验的提炼来回答问题。科 
学家可能会提 出能欺 惊人的理论，但这样的理论能否满足我们人类的信仰需 
要，则是一种私人事务，无关于科学探索的意义。“相信科学”就意味着接受 
一些判断，它们建基在能被复制的观察之上，而不是其他类型的证据或心理过 
程之上。 

现在你已经熟悉了科学的基本元素，比如变撞、测最和假说。本章我们将 
集中讨论的是，如何给我们关于世界的观念配备一种形式，使之能接受现实的 
检验。接着，我们把现实检验过程分解成几个部分。最后，我们将看看，为了 
理解研究结果，需要采用哪些评估步骤。 

以下各项的设计，旨在为科学分析提供逐步的指导。不过必须意识到，我 
们只足试图把握住科学程 序中圾 重要的方面，而不是老到的研究者想引荐的 
那些繁枝末节或是错 综复杂 之处。下一章以“提炼”为题，会对每个要索补充 
—些看法，以增强你在研究策略上的能撖。 

情记住，我们在这里所做的一切，都是调节人类思维的自然状 态：思 维与 

现实检验之 N //在的一种张力。所以这一牽分为三个 部分： 仔细思考问题、现 
实检验和理解结果。 • ^ 


仔细思考问題 

做研究时的 M 人挑战来自于起始阶段。一旦你逍遇挑战，其他步骤随之 
而来。难题就在于限制主题，或更明确地说，就是选择一条通向主题的途径， 
它要能般有效地使你到达你想要理解的东西。大多数学生都有过写一篇冗 
长、散漫、没什么主题的论文的经历。到最后需要下结论时，有时候却尴尬地 
发现，从已经提供的证据来看，没什么坚实的结论可下。出现这种丧气的结 
果，其原因通常能在起始阶段找到。 

焦点 

由于我们大部分人没受过这样的训练，即用假说的形式阐述我们的观念 
并检验它们，因此，我们最好从现在开始，按照事物出现在心灵中的方式来记 
下它们 ：连串 的主意、想法和观念。追问自己 ：“我 为什么对这感 兴趣？ 我究竟 
想要什么？”看看有什么发生。你可以从一个广泛的主题开始。 


这个国家有个大麻烦。大多数人现时觉得政治不重要 
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与政治有任何瓜葛。政治就像个笑话。 

多大的一些问题啊！不过这里还有一个 主题： 现代民主是否奏效。 

在此阶段，用一个或两个段落来记述这些思想是个不错的主意。写在纸 
上！广泛地阅读资料也是个好办法，它有助于圈定调查的领域。但读得太多 
却可能是个糟糕的做法。在试着进行实际研究之前，要对问题的主体框架做 
通盘的考虑。 ’ 

假设你以类似下述两段的内容结束： 

在美国有些事已经变了。以前，似乎更多的人认为他们在一些事情 

上有重要的影响。也许他们认为政府可以把社会改造得更好，或者他们 

可能有更多的闲暇时间。 

如今，与我交谈过的大多数人都不关心政治，也不相信政府。谁有时 

间理会政治？另外，除非你有钱捐助，否则他们不会听你的。 

这些段落实际上包含一些槪念和变张关系网和一整耷假说。至少 
有迹象显示，更为集中的研究是有可能的。 

这个时候，我们可以幵展两层研 究：描 述性的和关系性的。描述性研究搜 
集与一种状况有关的信息。我们可以描述一种制度、事件或行为，或者它们的 
组合。好的描述是科学的开始。达 • 芬奇 （Leonardo da Vinci ) 对人体结构的 
粘彩注解和描绘，促进了几代医学专家对身体的理解。有些专门化的描述性 
研究所分析的是一个单一变笊的有关佶息，比如说，家庭 破裂。 它是由什么构 
成的？它发展到什么地步？情况是怎么发生的？什么时候发生得极频繁？对 
于更高级的分析形式来说，这些研究都是有用的资源。 

关系分析考察亊物之间的联系。其基本形式是探索两个变 W 之间的关 
系，比如说，信任和政治参与之间的关系，或是年龄和参与意识之间的关系。 
系列的关系研究能构成因果分析的 基础； 因果分析是一类特殊的关系研究，它 
把变 tt 之间坡有力的关系独立出来。 

前面几段对相关主题的初步考虑，似乎蕴含着一整套的关系。如果你急 
于刨根问底，那么下一步可能是做一种关系分析，分析参与和信任这个一般性 
问题的某个方面。 

假说形成 

由于主题窄了些，形成假说就变得更容易了。问题有两层 ： 有哪些关键变 
*? 它们之间有何关系？在我们的例子中，引起兴趣的一个部分包含着两个 
变量 ：政治 参与和信任。前面的那几段话暗示了两者之间存在一种关联。这 
个关联究竟是什么？有什么词语可以表达那种关系？如果我们不考虑因果分 
析，那么暗示的关系就很简 单了： 人们更愿意参与政治，如果他们信任政府，或 
者，如果他们认为这样做会有实质性的效果。 
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即便使用了这些词语，但我们终究还是把情况简化为两个变量和一种关 
系 ：参与 关系到信任。当然，大多数研究包含几条假说，它们可能被贯穿在一 
起，成为一个大型主题的构成元素。但是出于说明的需要，我们只讨论要求不 
那么高的东西。 

棵作概念 

操作概念，意味着给它配备一种形式，使我们能用某种方式对变化做出测 
世。第2章中，我们讨论过转概念为可用的变量，这个过程称为操作化。转概 
念为某种允许我们对变化做出观察的东西，是一个棘手的过程。要做得妥当， 
需要满足两个条件： （ 1 ) 可操作的变攮要尽可能符合原始槪念的意义（有效 
性）； （2) 对变化的测 M ： 能被他人复制（可雅性）。 

人们是否参与政治活动，对此问题我们该如何使之可操 作化？ 试试看问 
人们一些事关政治参与的简单 问题： 

• 你是否参加过政治会议、集会或 演说？ 

• 你是否为某个政党或候选人工作过？ 

• 你是否就某件公众事务写信给报刊？ 

• 你是否在上次选举中投过票，或是做别的事去了，从而避开了投票？ 

一旦给出答案，要做的就是在各个问题的答案中找出模型，或是评估一 
下，如何把这衮问题的回答合到一起。我们可以审视一下这些回答，肴看其中 
会出现什么样的主题或趋势。无论我们怎么去研究，答案总会提供一些线索， 
指示出有多少人在政治上比较积极。 

对政治参与问题的回答中蕴含的趋势，同样有助于评估我们的研究问题 
如果这些问题被问了很长一段时间，我们就能看出现今人们参与政治是变多 
还是变少了。对政府的信任这个 变故通 常是由下述问题的答案来测姑的： 

你认为你对华盛顿政府行事正当的信任能维持多久-直、大多 

数时间，还是偶尔？ ' 

回头温4下前面的几段，我们看到，主要的假说牵涉到，低程度的信任如 
何可以导致人们现今更不愿意参与政治。规范的民主理论认为 ，健康 的政治 
不仅要求某种最低程度的信任，也要求某种最低程度的公众参与政治进程。 

在这点上，我们将看看一位哈佛的政治学家罗 伯特. 普特南 （Robert 
Putnam ) 在研究中实际使用的研究策略。本书的附录 A 是普特南的一篇论文 
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的节录版，其文章题为《调来调去 .•美 国社会资本的奇怪消失》 

普特南灌输给我们的一个观点 是：低 程度的政治参与部分是因为社会团 
体中成员身份的减少。普特南在提出其理论和假说时，参考了早期的美国社 
会观察家亚力克•德 • 托克维尔 （Alexis de TocqueviUe ) 和当代社会学家詹姆 
斯 • 科尔曼 （James Coleman ) 的著作。③他论证说，由于缺乏信任，比起20世 
纪50年代而言，人们如今更少参与政治了。 

按照一般的预期，在自愿组成的社会团体中，成员身份会对人们有所改 
造，使他们更多地参与政治，创建民主所必需的“公民能力”。@该理论还说， 
早几代的美国人更积极地参加一些团体，它们有助于建立社会信任和社会关 
系。如今，人们可能不那么愿意认识他们的邻居，不那么愿意与朋友打交 
道，这样的关系使他们能看出“为互利而合作”的作用。简单说，这个论证 
就是 认为： 社会活动的减少造成了信任和政治活动的减少。如果我们不参加 
一些像家长教师联合会 （ PTA ) 或是保龄球联盟这样的团体，就不能学会彼此 
信任。我们因此也就没了解到，如政治这样的集体性活动会有什么实质效果。 
普特南和其他人把我们从团体活动中获得的社会关系、规范和社会信任统称 
为社会 资本， 科尔姑把社会资本定义为“提供帮助”的个体之间的社会 
关系。 ® 

阅读附录 A 中普特南的 文章； 我们将探讨他是如何做研究的，这有助于 
提升你的理解。这篇文章是为一项更大的研究计划而精心制作的一个概要。 
作者开始讨论了工作的理论背识•、提出和检验假说的步骤，以及其结果的深远 
意义。这是研究应该遵循的模式——即便是一篇简要的研究论文。 

在操作变 堺政治 参与的过程中，普特南考察了对几个问题的回答，其中包 
括上面列举的一些问题。他同样感兴趣的是，政治参与的减少如何关系到信 


② Robert D. Futnain , **Tuning In and Tuning Out ： TTie Strange Disappearance of Social Capital 
in America/' PS： Political Science and Politics, 28, no. 4, (1995) ， 664-683. 另外见普特南的另 
一篇文章， “Bowling Alone ： America’s Declining Social Capital," Journal of Democracy, 6, no. 1 
(1995) , 65-78. 

③ James Coleman, Social Capital in the Creation of Human Capital,” American Journal of 
Sociology , 94S ： 95-S120 (1988). 

④ 另一位观察家 写到： 由于团体身份而带来的“人际关系改造”，“不可能轻易地用笨拙的 
社会科学工具加 以测量 ”。 Jane Mansbridge v ** On the Idea that Participation Makes Belter 
Citizens,” 见 Citizen Competence and Democratic Institutions f eds. Stephen Elkin and Karol Sol tan 
(University Park ： Pennsylvania Stale University Press, 1999) ， 291. 

⑤ Robert Putnam t Bowling Alone \ The Collapse and Revival of American Community ( New 
York ： Simon and Schuster, 2000). 

⑥ Putnam t 666. 

⑦ James Coleman, Foundations of Social Theory (Cambridge, MA ： Belknap ， 1990) ， 304. 
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任以及社会资本。就像社会科学中的许多概念一样，社会资本并没有为操作 
化提供一种直接的、明显的手段，它不是我们能直接看到或计算的东西。它是 
一个很大的概念，普特南的理论只是为我们要寻找什么提供指导而已。他认 
为社会资本是由社团的成员身份带来的。这意味肴，对社会资本的间接测盘， 
可以是人们就可能参与的社团有关的一些简单问题所做的回答。 

呰特南把社会资本当做社团的成员身份来操作。他用一些调査问题的回 
答作为其工具之一，来测 M 团体的成员身份。他的理论引导他用下列团体中 
的成员身份作为社会资本的指标。 


国家 

体育团体 / 俱乐部 （％ ) 教会团体 （％ ) 

文艺团体 / 俱乐部 （％) 

比利时 

21.9 

8.9 

14.0 

丹麦 

34.8 

20.9 

10.3 

法国 

16.1 

6.2 

6.3 

德国（西德） 

27.9 

15.9 

4.9 

英国 

23.8 

19.4 

6.8 

希腊 

6.5 

1.8 

5.6 

爱尔兰 

25.6 

17.5 

3.8 

意大利 

10.2 

8.8 

6.5 

荷兰 

35.2 

26.9 

10.7 

新西兰 

47.7 

38.9 

n/a 

挪威 

27.2 

10.5 

8.2 

葡萄牙 

11.5 

5.6 

4.6 

西班牙 

8.3 

5.9 

3.3 

美国 

21.6 

33.4 

9.8 


定哪成反映 ft 会资林 f 的撕之 -。 元里的数字表示 自称賊 細那牲 
回答者的百分比。 ~ 

来源:作者对原始数据文件的分析 - Europe, 1990 Euroharom^rter Survey 34.0; New Zealand, 1999 New 

Zealand Election Study ； USA, 1994 General Social Survey 。 


• 教会团体 

• 体育团体（足球队、垒球联盟、保龄球 联盟） 
# 文艺协会（戏剧团体、乐团） 

• 工会 


• 友爱组织（獅子保护协会、麋鹿保护协会、共济会、国际青年 商会） 

• 服务团 

• 民间组织（童子军、红十字会、家长教师联 合会） 

表 3.1 表明了人们寅称自己是这些团体的成员的频率。尽管普特南主要 
关注的是美国的趋势，但这些描述性的数据表明，相较于其他许多民主国家来 
说，美国人参加社团的比例与其他国家相当或更高。现在，我们用团体成员身 
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份操作了关键变社会资本，因此，整个研究的组织工作已经准备就位。 

现实检验 


整理参考目录 

有了假说之后，在开展实际研究之前，最好是多读一些资料。这使你能在 
其他人的工作的帮助下，检査你的假说形成和变最操作。使用图书馆的数据 
库或互联网来査找假说中的变 a 。 论文、著作和网址都是能提供信息和背试 
的有用资源。通常来说，就相关主题发表的一篇期刊论文会有一些脚注和参 
考目录，这能让你知道与该主题有关的大多数 m 重要的文献。更老练的研究 
者会在开始就走这一步——它有助于我们在“仔细思考”这个阶段节约大 M 
的时间。然而，初学者在遇到社会分析问题时，经常显得很“冒失”。 

开展研究 


很多学生也许没想到开展这里建议的那种研究工作。如果你想做深人研 
究，这里提供的凋査数据可以在互联网上找到。⑧下面的例子是用作指导，不 
过它们应该能够表明社会科学研究是如何进行的 ，帮助 你能用 M 淸楚的可能 
策略来阐述你自己的研究计划。 

罗伯特 • 普特南以及在此领域工作的其他人，通过重新分析过去的调査 
来检验他们的假说。许多社会科学就是这样开展的。当研究者站在不同的角 
度来审视“老”数据、提出新假说时，就揭示出了新颖的洞见。在你做研究的 
时候，与同行协商，检査一下图书馆，看看在着手收集你自己的数据前，是否有 
你能用于检验假说的数据。 

在这种情况下，学者们通常査看综合社会调査 （ GSS , 对美国人的态度、舆 
论和行为的一项主要的学术性调査）中提供的数据，来考察社团成员身份的 
趋势与信任及政治参与的趋势是如何关联起来的。这不是普特南使用的唯一 
数据来源。他还参考其他的调査和团体保留的成员记录。 

在其理论的基础上，普特南提前认定，某些类型的团体成员身份在建立信 
任和促进政治参与上比其他的更重要。宗教团体、工会、家长一教师组织、民 
间团体和友爱组织是比较突出的——但是他的数据来源为许多其他类型团体 
中的成员身份提供了测世方法。 


⑧公众舆论和选举行为的国家选举研究导引，见 http://www.ufnich.edu/-iie8 /。 综合社会 
调査存档见 http://www. icpsr. umich. deu : 8080/GSS/homepage. htm。GSS 网上允许对调査数据 
做在线分析。罗伯特 • 蒈特南的书中用到的数据见 http://www. bowlingalone. com 。 




社会科学研究的思维要素 


普特南在其研究中讨论的调査问题，在近20年里每年都会被问到，这样 
他就能比较团体成员身份、信任和政治参与的趋势。总结对这些问题的回答， 
可以揭示出某些有趣的模型（见表 3. 2)，也能允许做一些有意思的观 察：例 
如，一些政治参与形式在减少，但是选举似乎仍很火。政府记录实际上表明了 
投票者参与的减少，那么对选举问题的回答是否可信?⑨我们同样也看到，对 
政府的信任也有实质的下降——参与减少与信任降低有关吗？ 

在任何情况下，表 3. 2中的结果尽管可能对于美国社会来说不太乐观，但 
似乎确实支持该项研究的一些基本观点——政治参与和信任都在下降。不 
过，比起简单地说“瞧，我是对的（或错的）！ ”一 项研究的结论还应包括更多 
内容。 

分析结果 


我们应该正确地分析结果。在这项研究中，真正的问题是，某些特定社团 
的成员身份是否更能促使人们参与政治和信任政府。我们有很多方法可以检 
验这种关系。其中一个方法是考察一段时间内的趋势。图 3. 1根据 GSS 和 
NES 凋査问题的回答中体现出的趋势，提供了一些初步结论。我们石•到，从 
1974年到1994年，教会团体的成员身份处于下降趋势（尽管只是稍微下降）， 
回答者中，对政府的信任也从1974年的商于40%下降到1994年的20%。这 
些结果似乎支持下述基本假 说:社 团的成员身份与对政府的信任有关 一 但 
它们必须接受 M 深人的分析。如表 3. 2所示，从20世纪70年代以来，对政府 
的信任实际上相当稳定（并且很低）。自 I 960 年后，自认的政治参与者似乎 
也有轻微的下降，但我们能肯定这是因为社团成员身份的减少而引起 的吗？ 

表 3 .2 I 960— 2000 年政治参与和倌任的趋势 


1960(%) 1968(%) 1976(%) 1984(%) 1988(%) 1996(% 〉 2000(%) 

出席政治性会议、集 

会或演讲 8 9 6 9755 


为政党或候选人工作 
在上次大选中投票 
一直/大部分时间信 

任政府 


• 1958„这个问题不是在1960年问的。 
来源： 国家大选研究，不同年份。 
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⑨出席总统选举的实际投票比例从 1992 年到 2000 年徘徊在 50% 左右。 NES 的调査很可 
能过多地抽样实际的投票者。与此同时，样本中一些实际上没有参与投票的人可能告诉采访者 
他们投过票。我们将在第 5 章讨论这些问题。 
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W 杏年度 


图 3. 1 1974—1994 年倌任和团体成员身份的趋势 

另一种分析方法是看看其他的 m 要变 用:对 这些结果有何 影响。 我们对社会资 
本理论的讨论表明，社团的成员身份一度减少，同时还表明，近来的几代美国人可 
能不那么愿意参加教会团体、服务俱乐部、友爱组织以及类似的社团。 

表 3. 3的数据似乎为此提供了支持。该表显示了不同年龄群体的百分 
比： 其中有些人没参加任何社团，有的加入了一个或两个团体，有的加人了三 
个或更多团体。由于我们感兴趣的不是年龄而是代，因此我们先_定一个晋 
级为成人的时间，根据该时间确定他们大致的岀生年代。⑩正如我们能看到 
的，在20世纪50年代变为成人的回答者（“ 1925—1934年段”和“ 1935— 1944 
年段”愿意声称他们自己是某个社团的成员。亊实上，其中每个年龄段的 
人中，都有31%的人加人了三个或更多团体 。 相反，到20世纪90年代变为成 
人的人（“ 1965—1974年段”） M 不大可能报告他们参加了多个组织。在我们 
设定用来测 S 社会资本的变 S 上，他们得分最低。 

表 3.3 依年龄段划分的社团成员身份水平 

年龄群 

出生年段 1925—1934 ~ 1935—1944 ~~ 1945—1954 ~ 1955—1964 ~~ 1965—1974 

进人〗8岁 _1948_1958_1968_1978_1988 

3属于任何团体 25% 26% 36% 37% 

斶于一到两个社团 44% 42% 42% 39% 41% 

厲于三个以上社团 31%_31%_29%_25% _ 22% 

来 源:作 者依据 1972—2000年 GSS 数据库中累积的原始数据计苒得到的 结果。 


⑩该表提供的是取自许多 GSS 年度民意调査的“综合”数据。这意味着，1972年调査时， 
一个20岁的回答者就放在“1945—1954年段”，而1992年调査时,20岁的回答者则放在“ 1965- 
1974年段” 0 




60 


50 
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社会科学研究的思维要索 


我们的结论是，有些事情在发生 ：信任 和某些政治参与形式在下降，美国 
年轻一代的社会资本水平最低。这与普特南的理论是一致的，但并没有“证 
实”它。我们还可以做更多的工作，来检验这些东西是如何关联在一 起的； 不 
过，与幵始的时候相比，我们现在对这个问题有了更好的理解。 

要强凋的是，通过参考多重现实检验，你就能了解到你建构的那种现实检 
验的功效。同时，其他研究能从整体上对你的发现进行核査。 

理解结果 


评估概念揲作和变量 ，量 

既然我们对这个主题有了一些研究经验，那就根据已经发生的亊悄，回想 
一下有关策略的每一个步骤。想出一种方法来操作一个概念与使它如研究过 
程中所预期的那样起作用，这两者之间有很大的区别。 

这项研究计划有一些 问题： 

1 •你能确定政治参与的测量方法是有效的吗？ 

2. 我们用作社会资本指标的团体，是否在建构人们的社会关系上扮演相 
同的角色？社会资本仅仅是研究者为解释数据而创造的一种抽象概 
念吗？ 

3. 我们如何能确定社团的成员身份与政治参与之间存在着因果 关系？ 确 

定团体的成员身份和对政府的信任之间存在着因果关系？因果关系的 
方向是怎么样的？ 

4 -关于社会资本的争论是美国独有的吗？我们能否在欧洲或其他地方的 
调查数据中发现相似的模型？ 

我 们还® 要考虑一下，调査数据会以什么样的方式出现偏差。个人在回 

答问题时的精神状态是个问题。各种各样的因素都能影响到答案。例 如：女 

性访谈者从女性那里获得的答案可能不同于男性访谈者的。在不同的时间和 

地点重复研究很有用。如果你要大学生填写调查问卷，就得准备好应付校园 

里的小聪明。爱开玩笑、闪烁其辞和故意作对，人们能用许多方式搞糟调査 
问卷。 

另外一种可能阻碍研究者获得真实答案的因素是，回答者对研究计划、研 
究者、问题或答案的保密性存有怀疑。以前有位大二学生就大麻的个人用途 
对一个教会学院的职工做过调査。她私下做的访谈，并向每个员工保证答案 
是保密的——数据总结会按照部门和级别打散，最终的报告会收藏在图书馆。 
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然而，可想而知，一个小部门里的低级职工会对访谈者承诺的保密性保持瞥 
惕，因此在回答这类可能遭致检举甚至迫害的问题时不那么诚实。 

在和人打交道时，科学代替不了机智。 

澜量方法得当吗 

自我批评不是很受欢迎的事，但是在社会科学中，它能满足两个特殊的目 
的。它显然有助于你在完成计划后重新检査它，确保你每步都做得足够好，可 
以直接得出结论。不过，重新检査还有另一项功能。在处理如社会现象测量 
这类难以捉摸的事情时，在提出和使用 测量方 法的过程中学到的任何东西，都 
需要共享。研究开始的时候，测世方法可能看起来令人印象深刻。然而，实际 
中用起来时，可能会发现一些意想不到的弱点，如果在结果中把这些弱点作为 
— 部分陈述出来，就能节省其他人的许多工作。 

在罗伯特 • 普特南的社会资本研究计划中，人们参加了成百上千的不同 
社团。在各种著作中，普特南强调，重要的是团体间的不同混合——而教蛍、 
体 fr 和艺术俱乐部通常是作为社会资本的基本储存库而被提及。⑪我们决定 
要测嫩的那些特殊团体之所 以里要 ，是因为不同的测世方法通常会导致不同 
的结果。 尽竹图 3.1 表明教会团体的减少对应捋信任的降低，但同样的 GSS 
i 周査问题却表明其他社团的成员在增加（体脊团体、学校的友爱组织和职业 
协会）。 

那么，究鹿是哪些团体 M 好地孕育出民主社会必须的规范、网络和社会关 
系呢？我们滿要了解这一点，以便了解该使用什么样的方法来测蚧团体成员 
身份。如果像保龄球联盟这样的体育团体很重要，我们就可以问别人，他们是 
☆以联盟成员的身份去打保龄球。但是对该问题的回答能如实 地测狱 他们是 
#或片如何与保龄球同伙打交道吗？此外，如果许多回答“是”的人，仅仅是 
因为体育教育而上了高中保龄球班，那我们的测憊方法还有什么作用?⑫ 

记住，社会资本背后蕴含的观念是••团体成员身份能促进人与人之间的联 
系，从而建立起信任。更可信地测量社团影响的方法，可能是询问人们所属团 
体的信息，然后问他们会花多少时间与该团体中的成员见面。这也许能更直 

接地测量社团对人们的影响。 GSS 还包括一些问题，如志愿者的工作情况、参 
加某个团体活动的时间。 


⑪见 Robert Putnam, Making Democracy Work : Civic Traditions in Modem / ta/ r ( Princeton, 
NJ: Princeton University Press ， 1993)， 以及 Robert Putnam , Bowling Alone ： The Collapse and Revimi 
°f ^rican Community (New York ： Simon and Schuster. 2000) 0 

⑫导演迈克尔 • 摩尔 （Michael Moore ) 提到，谋杀多人的凶手埃 里克. 哈里斯 （Eric Harris ) 
和蒂纳 • 克莱伯德 （Dylan Klebold ) 都在科伦拜恩高中学习保龄球。在戳穿那些有问题的因果推 
理时，他讽剌地表示，可能造成屠杀的是打保龄球而非社会信任。 
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那么，这种批评就等于宣布了测 M 方法是无效的吗？不，不存在完美的测 
量方法。关键是要能够在可能的候选测量方法面前，保住你自己的测量方法。 
研究者必须有好的证据支持其变量的测贵方法和变 M 的定义。比较不同测贵 
方法和不同观察手段所获得的发现，有助亍建立理解。 

统计数字可靠吗 

漫长的历史中，五花八门的神秘主义者观察鸟的内脏，以图发现未来的预 
兆或预测未来。精于统计数字批判的人可能是这个职业的现代继承者 （ 尤其 
是那些檀长在任何给定的统计数字中发现好消息和坏消息的人）。统计数字 
本身并不能为社会调査问题提供精确的答案，这个事实使某些人感到震惊，而 
对另一些人来说是种宽慰。我们可以轻松地说，统计数字会撒谎，或者说它们 
从不完整地传达整体信息，因此是无用的。但问题 是：统 计数字（或测栢）是 
对比什么而言的？对比如“多”、“少 "、“ 整个”或“一点”这样的语言概念，确 
实统计数字可以做到更加精确。虽然带数字的证据可能会误导人，但是文字 
更能误导人。象征性的暗示、含沙射影的用词、不稍确的语言，都能歪曲知识。 
科学观察方法的优点是，偏见更容易被楗露出来，因为对意义和程序的规定都 
非常明晰，能被复制。 

当然，错误的统计数字就如错误的文字一样，都容易被派上用场，而且科 
学代特不了常识。随狞对统计数字的深入了解，你会发现，研究者通常是用几 
种统计数字来总结一种状况，而不是只依赖一个指标，以此来弥补任何特定的 
统计失误。 

你的发现与有 关领域 的理论昀合得如何 

尽管一次简单的实验或调査就可能解决你心中的某个疑问，但它同样也 
能以一种有趣的方式关联到相关主题的理论中所包含的更普遍问题。 例如： 
了解教育如何影响到人们对总统候选人的评价，还是饶有趣味的。但是把那 
个发现嵌人到与人类境况有关的一整套观念中，则更有趣。在选举领导人时， 
我们确实值得信任吗？民主确实起作用吗？这些都是大的理论视角，但好理 
论不一定非要是重大的。有一些不那么普遍的理论却说明了事件的关键 
片断。 

科尔曼、普特南和其他考察社会资本影响的人在启动其研究计划时，讨论 
了社会理论、民主理论以及社团与政治关系方面的先行研究。他们引用了其 
他作家的观点，包括大力宣扬社团的“市民”效应的托克维尔。托克维尔本人 
在19世纪30年代写到，美国民主 M 重要的一个体现是广泛地参与志愿联 

盟-提供公共集会地的社团，其中人们学习一些技能，让自己成为更好的公 

民。这种讨论突显了与普特南的研究的相关性。他们表明，对政治失去兴趣 
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的原因可能是深层的社会变革，而不是当今的一群政治家，或是现今对负面广 
告的鄙视。 

在评价本章提出的研究时，参考一下你做过的广泛阅读。另外，如果时间 
允许，多调查一下其他人关于社会资本（或社团成员身份）与政治参与之关系 
的发现。想一想，如果在诸如慈善会、社区组织、运动俱乐部和民间团体这样 
的各类社会场景中，更多的人彼此交往，民主会怎样得到加强（或能否得到加 

强 ）。 

科学程序本身是沉闷的。在富有想象力的研究者手中，它变成一个非常 
有用的工具，但是心灵这个仪器比任何调査程序要微妙得多。当科学成为方 
法，就被作为科学家的人类掌控。 

—位著名的科学家曾经评论到，“科学就是观察”，他的意思是说，只关注 
实验组和控制组的细节、统汁数字等，就会遮蔽科学研究的 目的： 用你的头脑 
来理解正在发生的事情。⑬关于一种特定的现象，不存在完美的实验来说明 
所有的一切。提防那些声称他们已经证实一些东西的人——尤其是用基于数 
字统计的“事实”所做的证实。把科学方法当做批判工具和发现方法加以使 

用。挑出易受责难的假设和证据的局限性，这样你就能知道什么被证明了，什 
么还没有被证明。⑭ 

把你的 「.作 和理论联系到一起并思考其深远的结果，你可以发挥想象力、 
创造力，尽哲不能漫无边际或沦为空想。有人观察到，在公社中人们能工作得 
史好 、过得更幸福。法国社会学家査尔斯 • 傅立叶 （Charles Fourier ) 把这 一* 观 
察拓展成一种观念••人类理解的提高会改进（通过数 百年） 世界的进程，使其 
达到乌托邦的境界，人们列队开始每天的生活，海洋将会变成柠橡汽水，友好 
的鲸鱼带领我们跨洋越海。这可就有点过了。 

引入的概念 


♦实 （ fact ) 关系分析 （ relational aralysis ) 

真理 （ truth ) 操作化 （ operationalization ) 

可证伪的陈述 （ falsifiable statements ) 社会资本 （ social capital ) 
描述性研究 （descriptive study ) 


⑬ Robert Hodes ，“ Aims and Methods of Scientific Research ， ” Occasional paper no. 9 ( New 
York: American Institute of Marxist Studies, 1968), pp. 11-14. 

⑭对科学使用成问题的例子，见 Daisie Radner & Michael Radner, Science and Unreason 
(Belmont ， Calif. : Wadsworth, 1982 )。 
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讨论 


r . 科学中有种“现实检验”牵涉到一种对照 ：把某 个被观察到的关系，同如果 
变量之间不存在关系会出现怎样的结果加以对照。看本章中的表 3. 3:如果年龄 
段和一个人参加的团体数之间没有关系，那么可能出现什么样的数据？ 

2.本章列举的社团是否反映了人们在其中发展“那些推动互利合作的网络、规 
范和社会信任”的地点？当人们隶属这样的团体时，你想想他们会做 什么； 他们会 
同意你个人的看法吗？联盟或职业协会是否也是可以建立社会资本的团体？ 

3•你能想到用其他的方法来操作化概念“政治参与”吗？操作化概念“对政府 
的信任”？ 

4•就政治参与问题，你认为回答者能给出 即便不 完全精确但被社会认可的回 
答吗？是否有某种方法来设计一项研究，可以避免有效性这个问题？ 

有用的网址 


• 大选研究 （ http :// www . umich . edu / - ne & / ) 

查看一下政治参与和对政府的态度的趋势。该网站有一些表格，它们根据各 
种人口统计特征把调査问題制成交叉分析表。 

• 综合社会调査 （ http ：// www . icpsr . umich . edu ：8080/GSS / homepage , htm ) 
查看一下与社会和政治态度有关的数百个问题的回答。该网站允许你在在线 
GSS 译码薄中把任何问题的回答制作成交叉分析表。 

• Bowlingalone . com ( http ：// www . bowlingalone . com ) 

罗伯特 • 普特南著作的升级材料。包括社会资本的定义和书中所用的数据。 


“如果人们要探索任何新观念的所有可能性，而且相信以后的经验可以用于确 
证或修正最初的主张，那么热情和深信必不可少——因为科学的繁荣乃是建基于 
沉思的自由和无情的批判这一双重程序之上 的。” 

S •图尔敏和 J . 古德费尔德 （Stephen Toulmin and June Goodfield ) 

学蒋 r 解社会科学的方法论，就像学玩台球。它们各自的基本元素很简 
单—在台球中，有球袋的桌子、一些台球和一根 球杆; 在社会科学中，就是变 
M 、 测畎和假说。到现在为止，我们关注的一直是简单的击 球：一 条假说，带有 
两个相当明显的变《和对变 M 关系的 测撤。 科学就像台球一样，更梢巧的策 
略都是从基本的技巧变化而来。 

优秀的台球选手若非绝对必要，绝不尝试更困难的 一击； 社会科学家也是 
如此。同样，为 了把错 误降到 M 低并绕过障碍，两个领域中的专家都必须发明 
新的技巧。我们将在本章和下一章中，以一种稍微不同于前几章的顺序讨论 
社会科学的元 素：先 是假说、变敏，然后是 测贵； 我们还会对每个元素做些提 
炼。换句话说，我们将展示的是擦板球人角袋。 


假说 

—假说并非从不受思想和偏好复杂影响的理智中一次成型的。就像其他人 
类行为的产物一样，假说是意向、学识和关注所构成的综合体的一个部分。社 
会科学家就如何处理这个现实，激烈地争论了很长时间。有些人提出，为了维 
持专业社会科学的名声，集中于“客观”的探索工作，研究者应该尽可能忘掉 
价值和其他偏见。另一些人坚持认为，忽视假说的来源是徒劳的，因为这会导 
致研究者忽视他/她自己在处理数据时的一些基本因素。 
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至于假说如何与理论、模型或范式这样的思维结构相吻合，存在一系列的 
问题。毕竟，工作的最终目标是形成有用的理论。因此，理论和研究之间的关 
系需要探索。 

最后，在能被吸收进假说的那些关系中，还存在一些更平常的但有影响力 
的东西。这三个主题—在假说形成中的价值、理论和关系角色，会依次得到 
讨论。 

价值和假说形成 

价值这个概念本身很特殊。写作的人经常试图把握价值是什么，如何把 
一个价值与其他价值隔离开来。麻烦的是，价值很难被孤立出来。我有信仰 
的自由，但没有消除平等的自由，也没有自由采取某些类型的行为，如偷窃。 
价值发生在彼此互相调节的境况之网中。①我们所有人体验到的那个矛盾困 
惑的自我，可能经常会在不同的时刻展现出不同的价值集，只有在一段较长的 
时期，才出现较大的、明显的价值模型。不过每个人的性格还是有种一致 
性—足以使我们确实能够对人们的人生定位做出一般评价。 

社会科学家经常建议，研究者在提交项目报告时要讨论其价值定位，以此 
来解决价值与研究的关系问题。由于在形成假说、挑选测谢方法和评估结论 
的每一步中，价值都是一个密不可分的部分，因此这个要求相当不错。不过， 
详细澄淸其价值不能是事后的补记。研究伊始，价值的角色就必须直接面对， 
巧则你就町能#不出价值对研究的影响。例如，有很强宗教信仰的人在研究 
约会习惯时，提出的问题可能就预设了婚前性交是不道德的。所用的问题很 
可能反映出这种偏见，诱使回答者谴责他们实际上赞同的行为。 

理论、模型和范式 

假说或调査现象的理论和模型之间的关系，似乎是清清楚楚的，但是当作 
荇试阌把这种关系见诸笔端时，却变得越来越复杂。我们知道，理论是—套有 
关系的命题集，它试图说明或有时是预测—系列的事件。我们也已讨论过假 
说是什么。大致说，理论是被某种逻辑框架关联到一起的假说构成的集合。 
至于理论提供的理解是否有效、是否正确，“理论，，这个词语暗含着它在这个 
问题上有一定程度的不确定性。因此，理论是尝试性的表述。被证明难以被 
证伪的理论通常包含在“规律，，或公理集中。 

另外两个词也被列人了讨论范围。科学家使用模型这个词语传达的含意 
是理论中更严格的秩序和体系。模型提供了对现实的简化，能接受对关键关 


①就价值如何与槪念和意识形态相关联这个问题，有很精彩的讨论，参见 Michael 
Freeden ， Ideologies and Poluical Theory： A Conceptual Approach ( England : Oxford University Press 
1996)， Part One 。 ’ 
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“哦， S 瑞森先生，您是我听到的第一个在现实生活中使用‘范式’这个词的人!” 

系的检査。例如，经济学家竭力构造理论模型，这样，失业、通货膨胀和其他与 
经济行为有关的主要变 M 就在数学上被关联起来了。 

范式（源自拉丁语词根，意思是“模型”）这个词语指更大的理解框架，由 
更大的科学家共同体共享，它把小尺度的理论和研究组织在一起。在古代的 
数个世代中，统治天文学的范式认为地球是宇宙的中心。早期的宇宙观察者 
试图在这个背妖 F 说明所有其他的恒星现象。当然， M 终由于出现了有力得 
多的解释，所以这个范式轰然倒塌了。 

社会科学中很少有规律和 公理， 有一些普遍性的范式、许多理论，以及近 
来还有些有趣的模型。对于做社会科学调査的新手来说，他们最好把理论看 
做是一种研究指导-种组织和有效利用洞见的方法，可以用于去粗取精。 

社会科学中，理论有两种一般的工作模式 ：归纳 的和演绎的。归纳是指通 
过积累和总结各种研究以建立 理论； 演绎牵涉到运用一种理论的逻辑产生一 
些能被检验的命题。 

科学最广泛的形象是，研究者通过逐步的调査过程收集信息单元，然后把 
它们建成理论。 

接下来就检验该理论能否说明某个现象。把科学仅仅看成归纳，接受这 
种看法的危害在于，在建立研究的过程中使用的范畴可能反映了一种隐含的 
理论。结果，所谓的归纳发现是一种隐蔽形式的演绎。科学程序要求理论命 
题以一种可证伪的形式表达，也就是说，它们能接受观察的检验，以减少这样 
的偏差。尽管这个要求看似清清楚楚，但社会调査的价值负载沉重，而且现实 
检验工具有限，因此很容易出现错误的判断。 



44 方法 社会科学研究的思维要累 


在关联理论与研究方面，演绎是一种越来越普遍的方法。由于批评家对 
社会科学所谓的“客观”本质的抨击，研究者在此压力下开始理解到，演绎不 
知不觉地渗透到假说通常使用的基本概念的形成中。在美国文化中，资本主 
义政治经济体制的普遍境况，导致许多政治科学家、社会学家和经济学家把我 
们的体制当做好社会的规范，并且把所有非市场的行为模型归结到脱轨的、有 
负面效果的、不发达的等这类负面范畴中。实质上，这些标签的内涵是从一个 
更大的理论中演绎出来的，该理论暗含了政治经济体制的本质和正确性。不 
过，这些标签却以被归纳确定的“科学的”名号出现。② 

从这样受文化约束的假定出发，人们就更容易论证说，如果某个人依照物 
质私利之外的动机采取行为，那么他就是“没适应的”或“非理性的”，或者谣 
要治疗、调节。事实上，被标上非理性的行为可以满足资本主义社会中被压抑 

的需要，因而有助于人们适应困难的环境-例如，一位穷人买辆豪华轿车的 

行为。拥有一辆轿车，是这位穷人展示成功、求得自重和关注的一种方式。这 
种耗尽其食物预箅的支出，可能令中等阶层的观察者深感愚蠢，这主要是因 

为，那些好歹有工作的中等阶层观察者不会逍受连续的拒绝和个人屈辱所带 
来的压力。 

由于演绎是一种自然的思维模式，所以需要用于科学探索。从理论出发 
的演绎通常提供了研究领域的基本议程。已确立的理论能指导人们找到许多 

特殊谜题的解决办法。在从事新一轮的说明任务时，演绎法是相当值得尝 
试的。 

我们不筘要过于关注归纳和演绎。优秀的科学研究总是包含一些元素， 
它们能让 K - 他持不同视角的人判断其价傲。 记住 这些要点的主要原因，是要 
瞥惕自欺 、驁 惕其他人在提出其科学发现时的一些误导性的方式。 

远在你有能力提出理论以前，你多半就已经是其他人兜售的理论的消费 
者。理论赋予结果以意义，在运用研究结果时，关于理论有个预防性的问题需 
要提出。它类似于研究背后的价值这个问题，就是对理论视角的理解，而理论 
视角是研究得以实施的前提。在读社会科学著作时 ，一 定要仔细关注引言和 
前言-这里通常点出了作者工作的关键之处。 

与此同时，不要害怕运用那些理论性的说明，要把它们作为你自己努力的 
一个指南。科学是民主的，任何人都能对一个理论做研究批判，或者尝试用新 
的方式加以拓展。留意一个领域中占支配地位的理论，借用其观点来看看能 
为一种现象提供什么样的说明，这能节省你自己的时间。 


②参见 Murray EdeJman , Political Languages •• Words That Succeed and Policies 
York ： Academic Press , 1977 ) c 
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假说中的关系 

自变里 •和因变量。并不是所有的变量都是同等的。如果社会科学只是要 
表明，偏见与无知有关，年轻与叛逆有关，智商与哺乳有关，那么社会科学家并 
没有做到如我们合理期待的那样多。人们的偏见是因为他们无知吗？或者说 
无知是因为他们被偏见蒙蔽吗？哪个是先导？我们几乎脱口而出谁因谁果， 
但没有，这是因为对因果关系的判决性证明需要精密的程序。变量中的自变 
M 和因变 M •这对槪念是一种方法，可以在不用通盘解决的情况下，巧妙地处理 
因果问题。 

G 变世影响因变量。例如，热 M 增加，空气中就能保存更多的水分。热 M 
是自变 M , 而能悬浮在空气中的水分是因变景。水分的状况取决于温度的变 
化。如果空气潮湿 而热撤 减少，水就会从空气中滴落——这就是社会科学家 
所谓的“降雨”。 

在第3章的例子中，普特南和其他人认为，政治参与取决于人们是否积极 
参与自愿社团。政治参与是因变掛，社 团中的成员身 份是自变撤。据说，积极 
投入社团活动能逮立个人的关系和信任，使人们有能力参与政治活动。这样 
就有了下述 假说: 社团活动越多，政治参与就越多。 

有个好办法可以让你看出一种被假定的依赖关系是否有意 义：颠 倒一下 
你正考虑的那种关系。投票或参加政治活动是否能导致人们加人教会团体或 
保龄球联盟？也许能，但是你需要一个有力的理论来说明，为什么这种关系会 
在那个方向发生作用。社会资本理论就提供了一种令人信服的论证让我们相 
信，社会活动是政治活动的先导。 

在很长的一段时间里，自变 M 和因变 ft 这两个槪念没什么麻烦之处。看 
看教育和投票决定之间的关系，就能轻易发现，投票不可能是教育的原因。但 
有个事实却颇为 麻烦： 自变®和因变粗:的关系在令人信服地得到证明前，只是 
研究者的一种想象虚构。自变 M 和因变 fit 之间的关系是研究者假说性地提出 
的： 他们发明了这些关系，然后用观察和分析来检验它们，看它们是否确实如 
想象的那样发挥作用。 

当我们用社会科学家最喜爱的形式——表格——来考察时，自变贵和因 
变世的问题就变得更容易理解了。表格是展示数据的一种方法，但表格背后 
通常隐藏着新手容易忽视的假说。 

看看表4.1。哪个是自变最？哪个是因变量？你如何重构这些数据所支 
持的假说？ 
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表 4. 1富人与穷人的政治 活动: 收入群体的活动比例（％ ) 





年收入 



低于 
$15 000 

$15〜 

35 000 

$35 - 

75 000 

75〜 

125 000 

高于 
$125 000 

用于竞选活动的钱 

2 

14 

29 

20 

35 

选举中的投票 

14 

32 

43 

7 

4 

接触官员 

12 

28 

46 

8 

6 

抗议 

12 

30 

46 

5 

7 

投人活动的时间 

13 

30 

39 

8 

10 

占美国人口的比例 

19 

36 

36 

6 

3 


总计 


100 

100 



来源: Siting Vrrt>a f Kay Lehman SchJazmm & Hcmy E. 
The American Prospect 、 May/ June 1997) • SJ 见 http ： 
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两个变 M 是收人和政治活动。这些数据表明了哪些收人团体主导了某些 
活动。它们揭示了这两 个变竜 :之间的何种关系？答 案是： 有的群体尽 tr 
只占美国人口的3%，但比起不那么商有的群体而言，他们参与各类政治活动 
的比例要大得多。他们为竞选提供了 35%的资金支持。锻穷困的群体占 
19%的人口，但在投票人赞助选举资金中只占2%的份额。因此，收人影响了 
各类人群的政治参与。 

因此，收人被认为是自变量，而政治活动是因变量。要检査“自变 坩”和 
“因 变爾: ”名称的分派，颠倒一下假说。比如说，投票行为决定了 收人？ 胡说 
八道！ 

表 4. 1展示的是通常悄况下表格出现的形式。自变械横列于表格顶端， 
因变 M 沿側边朝 F 放®。表格以这种标准的方式呈现，研究者想都不用想就 
可以定位关系。不过，看着表格，阐述它旨在检验的假说，是一种很有益的实 
践。作者可能出于强调、风格或方便，颠倒因变墩和自变敢的惯常定位。 

替代变贵、前置变用:和中介变量。在提出有说服力的假说时，核心问题之 
一是理解变贵之间的关系。在就变量间的关系提出假说的过程中，你需要留 
意你没有选择的变量，它们可能影响到关系的变化。社会科学家通常会提到 
替代变 M 、前置变量和中介变最。 

三个术语都有常识意义。替代变 M 是额外的自变虽，它影响到因变贵的 
变化。前 S 变量是某个先行物。例如，出生之前要先怀孕。中介意味着中途 
出现。我们会更精确地阐述这些概念。 

如果有人考虑一些影响人们对政治活动的贡献的变量，就会有这几个出 
现 :性别 、种族、职业、党派、对政府的态度，其他一些因素也可能有影响。这些 
都是替代变遺。不过，在收人和对政治活动的贡献之间建立关联（见表 4. 1 ) 
是有用的，尽管对人们为何做贡献或不做贡献的完整说明需要涵盖所有重要 
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的替代变童的影响。收入确实影响到贡献，但性别和其他变挞也介人了。如 
果重要的变景被忽略了，那么结果可能是无意义的，或者就如社会科学家喜欢 
说的，是虚假的。我们将在下一章再讨论虚假性问题。 

对前 a 变 M ： 的一种经典阐述来自对投票行为的研究历史。早期的调査清 
楚表明，教育层次越高的人越倾向于投票给共和党。从这种关系我们可以推 
测，受过良好教育的人在政治上比较保守。然而，结果证明，有个强有力的前 
® 变《影响到了教育水平和投票行为，它就是父母的財富。事实上，受过高等 
教育的人一般来自更富的家庭，而更富的家庭更有可能投票给共和党。在教 
育和投票行为的关联中，被测量的实质上是父母的财富对小孩政治倾向的先 
行影响。 

再来看中介变贵。假如别人告诉你，每片 Hollygood 面包所含的卡路里比 
其他6个品牌的低。这个广告导致你推 断：自 变量是 Hollygood 低卡路里的特 
殊配方。但结果却发现， Hollygood 公司的面包片比其他牌子的薄。面包中含 
有的卡路里 M 实质上与 Sunshaft 面包甚至 Wondergoo 面包的差不多。面包切 
片的薄度，就是面包品质和每片面包的卡路里含该之间的中介变 

还有一个更好的例 子：考 虑一下教育和社会地位之间的关系，这两 个变揪 
有正相关关系。然而，每个人都认识教育程度一般但地位很商的人。其原因 
可能是有另一个变《渗入了 ：事业 成功。 

要了解事业成功是如何介人教育与地位之间的，想想你认识的那些教育 
程度低但由于事业成功而地位不错的人 （ A 组）。再想想教育良好、取得成功 
且地位较商的人 （ B 组）。还想想教台良好而事业不顺且从传统标准来看地 
位一般的人 （ C 组）。 

如果你仅仅关注教育与地位之间的关系，或者是事业与地位之间的关系， 
而非所有的三个变《，那么你可能会错过任两个变量之间的关系。 A 组使你 
认为，教育和地位之间没什么 关联； 而 B 组则表明，地位和教育间的关系就如 
同花生糊与花生酱之间的关系。而 C 组的人尽管跟 B 组的一样受到良好的 
教育，但地位只是 一般。 如果只考虑事业成功与地位之间的关系，也会产生同 
样的混乱。 

一 般来说，受到良好教育的人 （ B 组）比教育程度低的人 （ A 组）地位要 
高。因此我们可以表明，教育有助于成功。不过，事业成功会介人到教育和常 
规的社会地位之中。 

为了避免陷人替代变量、前 S 变遒和中介 变量的 困惑中，我们可以在提出 
假说前做些思考。选取了因变 a 后，问问自己所有可能的自变 m 会有哪些。 
如果你想要说明为什么某些人是宿命论者，就想想可能影响这种心灵状态的 
所有变最。可能因素包括他们的工作性质、财务问题、单恋、深层性格、气候或 
同伴的影响。事实上，大部分乃至 所有的 社会现象都受到数个变量的影响。 



48 



社会科学研究的思维要素 


前 W 的自变 M : 


假设的自变 tt : 


中介的自变 M : 


假设的 M 变 M : 


政治体制 
自然资源 


州的税收和开支政策 


H 家经济政策 的影螭 


替代的自变 M 

教育体系 
运输网络 

变化的世界市场 


州的失业水平 


图4•丨彩响失业的自变置 

提出对替代变镦、前 S 变®和中介变姬的担忧，不是要打击你幵展你感兴趣的 
研究的积极性，而是让你记住它们，不至于把相关性混同于因果关系。 

再举个例子，考虑竞选活动中 频繁听 到的一个争论 ：州税 对就业率的影 
响。批评政府支出的人争论说，降低税收和开支会吸引不苒欢纳税的企业，从 
而增加新的工作和降低失业，这样就会剌激该州的经济。在图 4 . 1中，我们指 
出 r 可能对州的失业率造成影响的前贤、中介和替代变扱。 

仔细地梳理能揭示许多卷人的自变 研， 其中任何一个都可能比我们假设 
的变 m 更歌要，也就是比州的税收和开支政策更重要。尜实上，这件变愤之间 
的关系相当 g 杂。州的政治制度，如直接民主制，能利用立法提案和公民表决 
来降低税收和开支。然而，只要较高的州税为教疗体系提供了资金支持，就可 
能成为促进该州就业的关键，③ 

一旦你 认识了 对因变 m 有重大影响的那些变世，就有办法把某个变贵的 
影响与其他的分离出来。最简单的技巧是“控制” ：保持 一个变憊不变，检验 
其他两个变 M 的相互关系。在父母财富、教育和投票行为之关系的这个例子 
中，你可以挑选一个样本，其中回答者有不同的教育 层次来 自不同的家境 
假如结果表明，出自富有家庭且教育程度高的孩子主要倾向于共和党，而家境 
不好而教育程度高的孩子主要倾向于民主党，你就知道，在投票行为 上教育 
的影响远不如家境的影响。表 4. 2和表 4. 3说明了这个结果< 


③例如，参见 Bryan D . Jones , “Public Policies and Economic Growth in the American States ,” 
Journal of PolUics 52 ( 1990) ： 219-234, Jone 发现,公共部门的整体规模与经济衰退之间没有 ^ 
联，用于教育、高速公路、胬务和消防的开支，与就业增加、经济增长有关联。 
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随着你在方法论上的经验和熟练度的增长，你将发现许多技术可以用于 

梳理这些关系。要处理变 M 梳理这个问题，第一步是理解要建人假说的那些 

不同层次的关系。 

% 

假说中的关系层次 


相对最常见的语句而言，假说最明显的特征就是它在阐述每个术语时的 
谨慎。我们已经看到，变 S 的选择本身是个严肃的 任务； 同样，变 M 之间被阐 
述的关系也是如此。为了稍微延伸你的想象力，系统地考虑两个或更多变:敏 
之间可能体现出的关系，是很值得的。它们构成了一个连续统，我们将简要地 
讨论一下表 4. 4中的每种关系。 

第一种关系，虚无假说，真是天才的创造。记住，假说是想象的关系，然后 
投人检验。首先断定无关，然后检验，看看虚无假说是不是能被否证，也就是 
说,看是否能证明确实存在某种关系。这里面还有文章可做。 



表 4.2 

教育与政党认同 


政党认同 

―低教育程度 

卨教 育程度 

总计 

民主党 

150 

50 

200 

共和党 

50 

150 

200 

总计 

200 

200 

400 

来 源:換 拟的。 


表 4.3 教育与政党认同，控制财 S 不变 


政党认同 

来自贫困家庭 


来自苗裕家庭 


低教育程度高教 疗程度 

总计 

低教育程度高教存程度 

总计 

民主党 

100 45 

145 

50 5 

55 

共和党 

5 10 

15 

45 140 

185 

小计 


160 


240 


来 源:模 拟的。 


表 4.4 变置关系的类型 


关系 
虚 3 的 

推断的/关联的 
正向的/反向的 


因果的 


_ 意义 _ 

认定没有什么关系存在。 

认定有一种关系，但它处理的是一个变 M 对另一个变量的影响程度。 
认定有种特殊的关联性关系，其中两个变置之间存在一种可预测的关 

联一或者一个变量随另一个变 M 的增加而递增（正向），或者一个变 

董增 加而另一个变最减少（反向）。 

认定一个变最的变化是另一个变量变化的结果。 
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虚无假说的功用在于不让你做臆断——不是在提前为你阐述的关系做辩 
护。除了不承诺特定的关系外，你还保留了一种可 能性： 有种更实质的关系可 
能刻画了变 M 之间的 关联。 也许情况是，有一种推断的或关联的关系，将会产 
生于现实检验。甚至可能存在一种正向的或反向的关系，但这些可能性还要 
等到检验的时候出现。 

虚无假说正好响 应了谨 慎的社会调査策略的要求。要否证虚无假说，只 
能通过证明两个变最之间存在 着某种 关联。因果关系需要大 M 的证据，它与 
虚无假说相对，落在连续统的另一端， 

推断的和关联的关系可以得到检验，作为向因果关系迈进的准备。更次 
要的关系尽管有趣，也只是一种筛选手段。在教育和候选人对投票人的评估 
之关系一例中，如果可以证明统计上重要的关联，那么我们就有理由向前推 
进，分离出那些可能影响到此关联但旁枝末节的错误源头。一旦完成，我们就 
可以检验因果关系的替代源头，看看因果假说能否得到辩护。 

关于因果关系，有些事情需要理解。首先，社会科学的 M 终目标可能是确 
定孰因孰果。因此，确定因果性非常有趣。其次，它也是最难处理的关系，因 
为它需要程度的证明。要证明 A 是 B 的原因，你需要 表明： 

1. A 先于 B 发生 ，显而易见，不是吗？ 

2. A 的发生与 B 的发生有关。 这同样也是显而易见的，但事件间的关联 
并不总是容易发现的。例如，有些历史学家发现，中世纪改革者的饮食 
同他们细腻的洞察力之间，存 在着 穂定的关联。据称，圣女贞德误食食 
物，弄坏了消化系统，因而成为一位有远见卓识却昙花一现的女英雄！ 

3. A 导致 B ; 不存在其他 的变置 （ C ) 能消除 A 给 B 带来的变化。 这是难 
关所在。在一种境况中，只留下一个而消除所有其他的可能影响，总是 
非常困难的事。实验社会科学有一门历史悠久的技 术：挑 选两组受试， 
尽可能使两组的环境保持一致，然后在一组中引入被怀疑的因果变量 
( 实验组），而另一组不引入（控制组）。 

至于实验-控制组技术的运用中出现的问题，有个典型的例子，就是“霍 
桑”实验，其中，作为实验组的工人被安置在更愉悦的物理环境中做装配线工 
作。该实验组的产窜:一直高于在普通工场条件中工作的控制组。问题是，后 
来发现，增加的产 M 主要是另一个变量——经理和实验者本人对实验组的特 
殊关注的结果，而非物理环境。实验者不知不觉地引人了一些没有被控制的 
心理 因素： 两组的差别不仅仅是物理环境上的，因此破坏了实验-控制组程序， 
而导致结果的无效。 

在大多数社会科学家看来，对因果:关系的理解是假说形成和检验这一长 
串过程的顶点。在开始实施一系列的实验时，常见的做法就是分离出一个变 
世 ： 它与被引起的事件有最明显的关联。这种方式可以识别那些被怀疑的因 
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果关系来源。后续的逻辑步骤通常需要非常精心的实验安排。因此，这个领 
域的新手最好安心于那些更容易处理的关系。 

由于社会科学研究影响到一些重要的私人事务，所以很难在假说形成过 
程中培养谨慎的习惯。大多数新手对自己的假说自视过高，导致他们陷人测 
M 的困难和为得出结论而超负荷工作的失望中。在确定某种待检验的关系的 
强度时，要考虑一下可用的测量方法和数据资源。一项被完整报导的研究实 
验，总是包含着研究者对结论的深远后果的思考。但是，如果研究本身能观察 
到假说陈述和测量技巧的明显限制，那么这些思考就更合乎人意了。 

在假说中建立变*之间的逻辑关系和检验这些关系是否成立，当然是两 
码事。要看一种被假设的关系是否确实得到观察的证实，我们需要转向操作 
化和测 M 技术。 

变量 


樣作槪念 

早在我们对社会科学概念的讨论中，就肴到语言是如何从对不同现象的 
命名而开始的。对于一种特定的行为，人们专门约定一个名称，正是这种约 
定，构成了社会科学的语言。操作变 M 实质上意味宥，对-•种行为的命名要适 
合于某种观察和测®该行为的特殊方法。从某种意义上来说，变％操作就是 
颠倒语言的形成过 程：从 你感兴趣的现象的名称出发，往后回溯，找到一些方 
法，把那个名称与它所指称的特殊行为匹配起来。 

操作化 这个词语使这里讨论的过程听上去既特别又专业，然而事实上，它 
在日常生活中是老生常谈的。一天晚上，本书的一位作者在酒吧里听到关于 
肯塔基人和西弗吉尼亚人哪个更好的争论。“讨论”围绕下述观察展开 ：有个 
人的堂弟的叔叔的岳父来自肯塔基•他不是个好东西。不过 ，相 比之下，另一 
个人的前任老板的夫人的侄子来自西弗吉尼亚，他天生就该绞死！几轮争论 
后，显然 ，肯塔基人和西弗吉尼亚人的 品格这个变量，已经根据生活在那两个 
州的人们的犯罪行为倾向而被操作化了。 

在任何科学的发展过程中，用于指称被谨慎指定的 对象时 间或行为的变 
最名称，其数 M 会逐渐增加。如今在社会科学中，也有整套的变量目录，它们 
根据特殊的行为和可能的测最得到操作。④ 


④见 John Robinson , Phillip Shaver & Lawrence Wrighlsman, Measures of Political Auitudes 
t San Diego, Calif. : Academic Press, 1999) 0 
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有点值得庆幸的是，你感兴趣的变 M 早已被各种方式操作化了。即便如 
此，你也需要了解一些操作技巧，以获得分析的灵活性，同时也对其他人的工 
作保持批判态度。此外，当变通:需要的测馈形式超出你的资源范围时，你需要 
学会避开将出现的问题。有两种方法可用于处理由于某种原因而不易操作化 
的变量 ：替代 和分解。‘ 

假如你的假说是这样的 ：教育 程度越高的人，越有可能是社会主义者 。教 
育不难操 作化: 呆在学校的年头会告诉你接受了多少正式教育。 

人们是不是社会主义者，如果是的，他们的社会主义倾向有多强烈，则是 
另一回事。社会主义这种意识形态集合了一套复杂的理论、历史观、行为计划 
和好坏标准。如果你意识到，讨论这个主题的学者很难就社会主义的意义达 
成一致，就知道这套东西有多难理解。分离出社会主义的标准定义是个难题， 
但难上加难的是，在处理这个词的非共有解释上存在着问题：研究者很可能接 
受丫正式的意识形态概念的训练，而作为调査样本的回答者却可能认为，社会 
主义者是那些喜欢缻化水的人们。 

因此，“你是社会主义 者吗？ 如果是，到了什么程度？”向别人提这样的问 
题没多大怠义。这个问题的答案会产生一些关于自我知觉 （ self - perception ) 的 
有趣资料，但是如果把它作为一种方法，把回答者的态度与某种像社会主义哲 
学一样精致的东西关联起来，则显得太 随便。 替代 变佾社 会主义 ，或许可以解 
决其中一些问题。我们可以找到另一个变揪，它能确定更直接卷人的态度，并 
对之做具体的处理。看看这条假说 如何： 人们受教育越多，越支持工人参与 
管理。 

枰代的优势在于，我们可以就大多数人都能提出意见的事务提岀 问题而 
li 这种提问方式能把它们与该事务关联起来。即便它是个替代，但它圈定了 
社会主义怠 i 只形态的一个重要元索，从而提供了与那条一般性假说有关的 
信息。 

分解是另一种处理复杂变世的方式。行为一般都不简单，它发生在活动、 
态度和倾向互相关联的语境中。社会科学家所处理的变蛍，通常可以被看成 
坫行为 要索的组合。例如，变量异化可以分解成四种具体的 特点： 失范的、无 
力的、无意义的和无助的，它们与人们在异化时的通常感受是关联在一起的。 
态度 贵表的 提出就是为了测量异化的每个态度要索。通过组合所有的四个态 
度或感受的测 M ， 你获得的资料就可以称得上是与异化有关的。 

变量的维度 

变贵通常有不同的维度。测量人格的心理学家可能会提出内向人格和外 
向人格的分类。他/她还可能提出在 1-10 的度最表上对攻击性-回避性做特 
征描述。它们反映了一个变 M 的不同维度，此变量即人格。 
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民意通常用各种维度加以 分析： 

方向 ：意见 的赞同或反对 

位置： 在从赞同到反对的度量表上，该意见落在何处？ 

强度： 持该意见有多强烈或多无力？ 

稳定性 ： 它的可变性如何？ 

潜在 性：它 离意见结构的表层有多近？ 

突 出性： 与个人所持的其他意见相比，那个意见的重要性如何？⑤ 


所有这些维度都包括不同 的测童 可能性，也有各种可用的技术来处理它们。 
意见的方向只需要清楚告诉我们意见是“对”是“错”。另一方面，突出性可以 
把意见从不突出到非常突出做顺序排列。意见的 强度则 暗示了用刻度表示的 
可能。 

在对一个变 M 进行大规模处理前，好好想想你着眼的是哪个维度，想想还 
朽哪些其他的可能维度。挑选 出敁有 可能触及变笊核心的维度。通过考虑柙 
代的变欺，你就能 选定： 哪些维度把扼到了变 W 的关键，哪些维度可以用你资 
源范围内的方法得到测 W 。 与此同时，对变 M 的不同维度的理解，可以让你看 
到，在理解该变 M 方面，哪些工作已经做了，哪些还没做 3 

科学 M 持久的神秘之一，就是它居然能完全等同于测 M 。 就如本窜力图 
说明的，科学 典正的 创造力在于变 M 的操作化和假说的设计。它们经常滞要 
岚正的创造力。尽管有时候测笊接近于艺术形式，但它更多的是一种技术和 
数学概念的系统应用。就如我们将在下啟看到的，测 W 有自己的逻辑和巧妙 
设计。 


引入的概念 


价值 （ values ) 
理论 （ theory ) 
模型 （models ) 
范式 （ paradigms ) 


前置变 董 （antecedent variable ) 
中介变 董 （intervening variable ) 

虚无假说 （null hypothesis ) 

推断的关系 （inferential relationship ) 


⑤改自 Bradlee Karan, 44 Public Opinion and the New Ohio Criminal Code，” The College of 
Wooster Symposium on Public Opinion and the New Ohio CriminaJ Code, July 9-30, pp. 6-8 , 以及 
Vladimir Orlando Key Jr . ， Public Opinion and American Democracy ( New York ： Knopf，1961 ) ， pp. 
11-18 0 

Key 用属性而非维度讨论了变 ft 。 在讨论民意时，他在我们用“位置”的地方用了词语“维 
度”。就近来的用法来看，词语“域性”变成了一个通名，指称一个变最的所有特 性:它 的测量、它 
的各种实质成分，或是维度，但它们已经获得了更明确的意义，也就是我们提到的 意义。 
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规律 （ laws ) 

公理 （ axioms ) 

归纳 （introduction ) 

演绎 （deduction ) 

自变量 （independent variable ) 
因变量 （dependent variable ) 
替代变量 （ alternative variable ) 


关联的关系 （ correlative relationship ) 
正向关系 （ direct relationship ) 

反向关系 （ inverse relationship ) 
因果关系 （ causal relationship ) 

变量替代 （variable sabstitation ) 
变量分解 （variable division ) 

变量的维度 （ dimensions of variables ) 


讨论 


注： 检查表 4.2 和表 4.3 的数据。在该例中，表 4.2 考察的是教育和党派认同 
之间的关系。表 4.3 考察的是来自贫困和富有两种家庭的人对党派的认同。表 4 . 
3 引入了对家庭财产的控制，因为党派认同也可能与家庭财产有关。 

1. 当我们考察表 4.3 中的两个团体时，表 4.2 中的初始模型是如何变化的？ 

2. 党派认同和教育之间的关系是否受到收入的彩响？ 

3 - 关于教育和党派认同之间的关系，表 4.3 中的结果有何指示？ 

4 - 对于两个表格展示的模型，你能想到有何逻辑说明吗？哪个 （些） 是因变 
董？哪个 （些） 是自变董？为什么？ 

5.考虑布洛金顿等人 （ Brockington et al .) 的文章（附录 B ) 的回归分析中的变 
董，如果认为少数族群的代表性水平取决于选举规则和社团的少数族群，这种看法 
是否有意义？该因果过程是否也能在其他方向 发生？ 


变量和关系的测量 

Mt * asuriii ^ Variables ami Relationships 



“为月织衣裳，夜夜勤裁量。” 

- 纳撒尼尔 • 沃德 （Nathaniel Ward ) 

科学家主要测租三样东西 ：变量 、与变量相关的数据具有意义的几率，以 
及变量间的关系。每项测请任务都有独特的途径和统计技术。当我们考察这 
些任务的完成需要运用各种观念时，请 记住：测锨的 梢确性几乎总是名大 
于实。 

本荩在相当宽泛的意义上使用测 tt 这个术语。第一个主题是变异的测 
畎，我们将考察适宜于不同类型变 fit 的各种测接下来，我们考察一些用于 
描述数据怠义和代表性的技术，这些数据是通过科学程序获得的。有些技术 
町以相当梢确地判断，一组数据是否只是奇特样本的结果，而不是有意义的测 
W 的结果。在此过渡部分，我们将表明该如何构造抽样凋査，还会讨论一些常 
见的民意调査错误。然后，我们就变 M 间的关系测 ft 提出一些看法。我们的 
0的是要掌捤一些简化数据的基本工具，把与两个或更多相关变 S 有关的数 
据简化为一个统计 M ， 使之能刻画变量之间的关系。 

按照惯例，测量作为一个术语只适用于第一个主题。第二个主题关注的 
是数据的意义和代表性问题，并且使用了槪率，而概率在最狭隘的意义 t 并不 
是一种测 M 形式。第三个主题通常被认为是刻画事物之关联的问题，严格说 
来也不是测量的问题。然而，所有这三个主题都与确定某物的数 M 相 关：变 
异、意义和关联。因此，所有这三个主题一直都被恰当地归在测 M 这一总类 H 
之下。 
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测量变 量:测 量层次 

测 M 是个富有欺骗性的 主题。 初看起来，它似乎很简单——测 M 是回答 
“多少”的问题。当谈论长度或重 M 时，这个问题看上去相当容易回答，但当 
考虑信息化水平、人格特征、情感和态度诸如此类常见的社会科学素材时，这 
个问题就不那么容易回答 r 。 困难的原因，与其说在于总计事物的个数，倒不 
如说在于被计算的事物的本质。 

例如，在测 M 变廬时 ，有三方面的考虑可以确定我们能尝试哪一测量层 
次，因而也确定了使用该变域可以提出哪些类型的假说性 关系： 

丨.变量的属性或特征。 

2. 适合于这些属性的测量技术。 

3. 根据变量的属性和可资利用的技术，有哪些可能的测量层次。 

举个例子，考虑婚娴状况这个变 M 。 它指的是根据法律界定的一种 分类： 
单身的（又可再分为未婚的、离异的或丧偶的）或已婚的 （或许 又可再分为一 
夫一妻或非一夫一妻）。在“测佾”某人的婚姻状况时，这个变 ® 的慽性规定， 
你只能对它进行分类—不可能说某人结婚的程度非常商，或某人结婚的程 
度非常低。从法律的角度看，你要么结婚要么没结婚。一旦这样一种 属性已 
定 ，婚姻状况 这个变狱并不滯要十分花哨 的测坩 技术。 

智力这个变撤则提出不同的测狱可能性。这个变狱的域性，并不仅限于 
对单纯分类的 考虑： 它所具 有的厲 性暗含狩相对大小的贵。正是在这一方面， 
技术 开始被采用。几个世纪以来 ，人 们一直对如何测飧智力这个问题感到困 
惑。相关努力包括，测试人们遇雨时是否懂得躲避—在这种情况下 ，智 力可 
以被分成两类加以测 M : 那些慷得遇雨时躲避的人和那些不慷的人。然而，研 
究还在继续，而我们已拥有了智商测试。智商测试使我们了解到，人们如何能 
够很好地回答一些特定种类的问题，这些问题被认为与智力有某种 关联技 

术上的这种进步，使我们可根据与智力有关的量表，在其两个端点之间进行一 
定程度的细分。 

测量本身自成一个研究领域。研究者一直想方设法发展测量技术，这些 
技术可以探究重要变最的所有属性。为了使我们对各种可能测量的理解系统 
化，科学家已经提出一种分类，这种分类包括四种测量 层次： 

1•名目（定类测 量〉。 

2•顺序（定序测量）。 
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层次 

变 ft 属性 

允许你 进行： 


图解 


1•名 B 

分类 

俄国人 . 芬兰人， 

挪威人 

伊格 

' 辛尼卡_ 

奧拉夫 

2.顾序 

分类 

O 

U 

1 

阶级 阶级 

| • 

1 1 1 广 


flFfy - ?■ 




3.区间 

分类 

排序 

1000 500 

B . C . B . C . 0 

500 1000 1500 2000 2500 3000 

A . D . A . D . A . D . A . D . A . D . A . D . 
iiliiail iiiililiillllll 1 1 1 1 I 


设定标 准距典 单位‘ 

零点 




(任意) 


例子 


种族划分、种族、宗教、 
性别、婚姻状况、职业、 
团体情感 


阶级、社会经济地位、 
正规教育 


公元纪年、华氏溢度 


4 .比例分类 

抟序 

设定标准距离碘位 
定位绝对零点 


§ § I § I I | I 益 、年龄、体*、 

ri 寸必 00 一 — 




图5.丨测量层次 

3. 区间（定距测量）。 

4. 比例（定比测 量）。 

上述测馈层次的特征在图 5. 1中得到明确说明。名0层次似乎与测 :揪并 
不完全一样，它指的是事物的分类。以种族划分为例。假设辛尼卡是芬兰人， 
伊格是俄罗斯人，那么，我们说的就是两个人所具有的某种厲性，这—厲性与被 
称 为种族 划分的那个变 M 有关。这是测《，但并非十分花哨的测敏。我们不可 
能把芬兰人排在俄罗斯人之上（除非根据另外某 个变铀 ——比如对腌制鲱鱼的 
喜好，即使是那样，他们的喜好也会很接近）。因此，作为一个变揪， 种族 划分的 
厲性只允许分类或名目测甩。①名目测量，尽管层次较低，但总是时不时地出现 
在社会科学中，如图中所列举的 例子: 种族、宗教、性别、职业,等等。 . 

如果变请的属性除了允许分类之外，还允许排序，那么，只要有可资利用 
的技术，就可以尝试顺序层次的测嫩。在这一层次上，我们可以用某个连续统 
来思考，所谓的连续统就是一种排列，它能够显示变故的变化，与单纯分类不 
同。阶级是一个例子，社会经济地位则是另外一个例子。我们可以说，艾冯斯 
属于上层阶级，而迈克属于下层阶级。这些是分类，但它们按照从低到高的顺 
序被排列在一个连续统中。正式教育也一 样：安 琪莉娜拥有博士学位，玛丽受 


①在每一个伦理群体内，我们可以以门第为基础，鉴定某个人的遗产属于某一族群的比例 
是多少，但种族划分这个概念本身是分类性的。 
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过高中教育，而珍妮则拥有小学毕业证。但是，博士和大学学位之间的“距 
离”与高中文凭和小学毕业证之间的“距离”并不相同。这是排序，但并非标 
准距离。对距离的具体说明——或者更一般地说，事件之间的变化量——是 
迈向测量领域的重要一步。距离明显提高了测量的精密性，根据这种精密性， 
某一变埴得以测量，并与其他变量发生关联。 

倘若能落实标准距离，下一层次的测 M •便“应运而生” ：区间 测量。在此， 
我们可以指定测 M 单位，藉以说明各个事例相互间的距离有多远。这样做合 
情合理，但仍有一个技术细节引起我们内心的困惑。它与测量量表上的绝对 
零点有关。 

区间测 M 没有真实零点。什么是真实零点？它有何用？以公元纪年为 
例，“零”年并非意味着，在那之前什么都未发生。我们确实不知道真实零点 
处于历史上的何处。零年是由于宗教原因在与基督生命的关系中被确立的， 
并且作为一个约定的参照系，起到前推后算的计年作用。华氏温度同样如此。 
我们都知道，华氏零度并不代表一个真实零点，因为零下 23 度比 0 度冷得多。 

比例 M 表的确 有茛实 零点。比例故表（比如距离）不同于区 间坻表 ，原因 
在于 ：例如 ，在一个比例尺上，零英寸就是表示枣英寸——根本没任何距离可 
言。不可能有小于0的距离，或小于0的重锹，或少于0的香蕉。上述这些向 
我们表明，處实零点与任意零点（或出于方便考虑被虚构的一个零点）之间的 
常规差异。 

但是，茛实零点有何用？答案取决于我们在比较比例或区间 a 表的观察 
时能够说些什么。如果哈蒂重200磅，劳瑞重100磅（比例歎表），那么我们可 
以看出，哈蒂的体重是劳瑞的两倍。但是，假如星期一的气温是 50 度，星期三 
的气温是 25 度（区间 a 表），我们真的可以说，星期一的气温是星期三的两倍 
热吗？你可以试图这么说，并侥幸事实确实如此，但实际上你不应该这么说， 
因为上述那种比较需要一个真实零点。当你要辨别某天的气温是另一天的两 
倍热时，你需要知道何谓热的完全消失。没有一个起点，距离可以被确立，，比 
例则不然。 

了解这些区分的原因事关关系的种类，这些关系可通过统计方法在变量 
内及在变量间加以确立。任务就是要避免苹果和橘子之间不同类别的比较。 
本书所谈及的统计学，只以数字背后的观念的形式出现——统计演算以及各 
种统计操作的精妙之处，都留给更专门的论著。在此，我们只满足于简单的论 
点 （ 就统计学的一般情况而言是很简单的）。大致 说来： 

在名目测量中，统计学处理的是每一类别中的事例频率（例如，种族 

划分：10个芬兰人，3个俄罗斯 人）。 

在顺序测量中，统计学描述事例依照某一变量的排序方式（例如，教 
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育 ：小学 、中学、大学）。 

在区间测量中，要在一个量表上对事例之间的量化差异进行比较 

(例如，年代= 1950年、1990年）。 

在比例测量中，要对事例之间的绝对距离进行比较（例如，钱：10美 

元，20美元）。② ' 

由于这些测量层次对于处理变量关系显得至关重要，因此，在继续研究之 
前，有必要弄淸楚每一变量的合适的测贵层次。当我们转向这个问题时 ：测童 
以相关 （ correlation ) 的形式体现出来的变《关系，我们就会明白更详细地阐明 
测量层次的重要性。 

测量数据的显著性和代表性 :槪率 、抽样和民意调查问题 

我们现在要讨论的这些主题之所以结合在一起，并不完全是因为它们都 
与测有普遍的联系，而是因为，它们都与分析数据的长处和缺点相关。这些 
主题就是概率、抽样和民意调査问题。民意调査为研究抽样和概率提供了一 
个有益的平台，但这些主题在社会科学中还有更广泛的应用。 

为了常捤科学研究必需的统计工具，我们有必要熟悉一个新概念•.概率。 
概率在社会科学中占据的重要地位，远非本书几处描述就能表明的。溉率构 
成了科学观点的基础。明了其原因，便能控制人类心灵中一些特殊的执拗 
习惯。 

槪率指的是某事发生的可能性或几率。我们计算下列事情发生的 概率： 
通过一门课程考试的几率、对一场约会的展望 、一 个队贏得一场比赛的胜算。 
《罗热的同义词辞典》（心 ㈣ 、 77 i « aW rM ) 列举了足够多的表示概率的替代词 
汇——幸运、冒险、机缘、命运、偶然、几率，以及其他一些词汇，这一事实表明 
概率这个概念在我们语言中的重要性。 • 

我们幵始就说，科学作为一种手段，有助于人类应对生命的不确定性。将 

②摘自 Sidney Siegel , Nonparametric Statistics for the Social Science ( New York ： McGraw-Hill, 
1956) ， p. 30 o 另请参阅 Chava Frankfort-Nachmias and David Nachmias, Research Methods in the 
Social Science, 6 lh ed. ( New York ： St. Martin’s: 2000)， Chapter 7 0 

对熟悉统计学的人而言,以下这些例子是适合于每一层次的统计量 清单： 

名目 ：样式 、频数、列联表 

顺序： 中位数、百分位数、斯皮尔曼相关系数、肯德尔 T 系数、古德曼•库鲁斯卡的伽玛 
区间 •.平 均数、标准偏差、皮尔逊积差相关、多重相关 
比例 :几何 平均数、变异系数 .0 LS 回归 
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思想观念从头脑中“驱逐”出来，迫使它们进入经验观察的领域，并且在经验 
中检验它们，我们就获得关于世界的知识。我们努力摆脱环境的不确定性带 
来的不安全感，正是这种努力，提供了科学体制赖以建立的动力。但是，科学 
知识的特征就在于，它很少会坚如磐石。时而明显时而隐晦，科学概推总是概 
率性的。 

科学是几率的提炼，这一点要远比发现确定性更常见。 事实上，社会科学 
家通常以一种语言来讨论他们的发现，这种语言表达了结果出错的可能性。 
他们为下列情况发生的可能性感到 担忧： 一组结果可能反映的是一个不精确 
的样本.或者，另外一位研究者可能会从我们的结果中发现不同的结果。规范 
地说，我们很少会认为，社会科学决定性地证 明了某 种东西。③相反，我们经 
常会说一个假说得到有效证据支持的 概率有 多大。 

概率以何种方式植根于社会科学之中？作为对这种方式的一种说明，我 
们将考察概率统计的两种具体应 用：其 一就是确定数据组的统计显 著性； 其二 
就是构建关于较大母体的代表性样本。但在这两种应用中，目标都是一 样的： 
尽力阐明一列数据揭示的不仅仅是 变世间 随机关系的可能性有多大。如果信 
息建立在一个劣质样本的基础之上，或者，如果它仅代表亊例的反常结合，那 
我们就不能说，结果向我们表明了变 嫩之间 有任何确定的关系。了解这一点 
是很重要的，而概率统计提供了一些工具。 

概率的第一种应用关系到从一个较大母体中抽取出的某个样本的代表 
性。假若一个样本的容 M 和特征已定，那么，我们从这个样本可 以推断 某一母 
体的特定特征的概率有多大？这种类型的概率，构成民意调査的基础。民意 
凋査人总是试图估计，打 W 投票给特定候选人的公众占多大比例。在尝试概 
括一个巨大人群的特征时，我们几乎不可能总是调査每一个人。选择最小的、 
姑具代表性的可能样本，是有效进行民意调查的关键所在。概率统计被用来 
估计一个样本具有代表性的几率。 

概率的第二种应用关系到估计一组观察随机发生的可能性。如果我们正 
在观察的结果，每100次中只有1次会随机发生，那么，这个模型就相当有意 
义。连接两个变董 （ 比如，收人和教育）的某个数据模型，每100次中只有】.次 
随机发生的儿率，那么，这个模型告诉我们一些有用的信息。无笛探究数学运 
算，我们便会认为，这一结果的 显著性水平为 0.01。将样本的观察次数、变撤 
的变化斌，以及所观察的关系强度结合起来，就能推出显著性的统计量。最可 
能的随机结果分布将表明，一个表格的每一格中的事例数目都是一 样的； 最不 
可能的随机分布，则是所有事例都出现在一个格子中。 


③来自科学哲学领域、对实证主义的一种有影响的批评，可参见 W . V . 0. Quine , “The 
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确定结果的显著性水平，构成一次重要的假说检验。最不可能随机发生 
的结果是，所有高收人的人都受过高程度的教育，而所有低收人的人都受过低 
程度的教育。自变量对因变 M 有相当强的影响。在母体中，收人和教育之间 
都极有可能存在某种相关性。显著性检验告诉我们，在特定条件下，我们的假 
说是对 （ 或错）的概率有多大。 

就其最基本的形式而言，显著性告诉我们“某种特定的关系……是否值 
得深人思考——它是否值得我们付出额外的努力”。④有些社会科学家可能 
只处理显著性水平为 0.01 的数据，而其他一些社会科学家则将 0.05 视为显 
著性水平的判定值——意思是说，观察到的关系，每100次中有5次随机发生 
的几率（与1次几率不同）。研究者已普遍注意到，显著性水平是研究报告的 
一部分，这有助于对结果进行评价。 

我们一直在讨论的两种槪率应用是相 关的： 前者处理的问题是样本是否 
具有代表性，后者则与结果具有意义的几率相关。笼统说，这个问题 就是： 


样本具有代表性吗？[推断] 

结策模式可能会随机犮生吗？[显著性] 


一个具有代表性的样本，为推断某一假说的支持度提供了坚实基础，尤其 
是当观察模型具有统计显著性的时候。但是 ，一 个褙糕的样本导致粞糕的推 
断，无论数据模型是否具有显著性。老无疑问，根据概率论抽取的样本被认为 
是概率样本。 

在抽样时所运用的技术，一般有两种••分层化和随机抽样。分层化涉及按 
比例展示样本中的車:要特征，藉此再造一个大的母体。假设我们试图测定某 
—社区对饮酒的态度，在当地一家酒吧选择一部分顾客作为样本进行访谈，由 
于此样本的特征对所思考的议题显得至关 ■要 ，因此会使它所代表的那部分 
公众超过比例，因为禁酒主义者不会在酒吧 泡着。 这样一来，我们必须以另一 
种方式来选择样本 ：使得 禁酒主义者亦有机会被包括在内。 

如果运用分层抽样方法选取一份样本，以检验选举中的投票行为，我们会 
设法获得这样一份样本 ：它按 比例反映出较大母体的特征——至少包括诸如 
阶级、宗教和教育等重要的自变世。但是，分层化（对投票者的特定特征进行 
比例抽样）必须被限定在一些数鼋相对较少的特征上。如若不然，为了按恰 
当比例填满所有变*的代表样本，我们可能会因为试图寻找那些极不可能集 
各种特征于一身的人们而耗费宝贵资源。 

随机抽样有赖于随机选取一个充分的关于母体的样本，以便这个样本有 
较高的概率再现整个母体的本质特征。随着样本容 M 的增长，样本具有代表 
性的可能性也在增加。例如，假如我们从一个全国人口为2 100 000 000的国 


④关于显著性测试的一个明晰而又通俗易懂的讨论，请参见 Lawrence Mohr , Understanding 
Significance Tests ， Sage University Paper Series on Quantitative Applications in the Social Science , no . 
73 (Beverly Hills ， Calif . : Sage Publications f 1990) 0 
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家中，随机挑选5个人进行访谈，那么他们并不真正具有代表性的可能性很 
高，也就是说，挑选时可能存在相当大的误差幅度。随着样本容量的逐渐增 
长，只要受访者是随机挑选的，误差幅度便会降低。 

对任何大小的母体而言，都有可能在数学上确定一个既定的样本容量将 
有多大的概率，产生某种可具体指明的误差幅度。误差幅度随着样本容量的 
增长而急剧下降，达到某一点时，样本容量的进一步增长将非常轻微地减少误 
差幅度。正是这个点指示了最经济的样本规模。越过这个点，再增加两倍或 
三倍、甚或十倍的样本容 M , 所能降低的误差幅度还是会相当少。 

随机抽样的一个主要问题在于，为了访谈所有被选中的人士，访谈者不得 
不分散他们的努力，并且不得不在整个母体的各个角落中寻找受访者。大多 
数科学抽样均同时运用分层抽样和随机抽样。例如，在一个全国样本中，研究 
者可以挑选有代表性的市区，以及有代表性的乡村（分层化的一种形式），然 
后在这些目标区域中抽取一个随机样本。 

电话抽样，尽管对那些没有电话的人存有偏见，但已经成为一种日渐流行 
的技术，因为计算机使得在特定电话交换机内进行随机拨号成为可能。然而， 
通汛技术中的革命，正给电话抽样带来新的偏差。寻呼机、 BP 机以及电话答 
录机，都与大多数的电话交换机相连。公众对电话（电信）骚扰的惝怒可能会 
提岛对凋査研究者的拒访率。良好的电话样本仍可以被抽取，但随狞研究者 
努力降低这些新的偏差的同时，成本也在提商。互联网为成立应答者会谈小 
组创造新的可能，我们可以就一些重要的问题对他们进行调査。 

为了进行美国民意调査，一些主要的学术性、商业性，以及媒体民意调査 
(皮尤研究、盖洛普、哈里斯、有线电视新闻网/今日美国、舟伦比亚广播公司/ 
纽约时报 、 ABC 新闻/华盛顿邮报、美国全国广播公司/华尔街日报），均运用 
一种分层的随机样本，目的首先在于消除不方便的问题 ：比如 ，访谈一位远在 
内华达州的偏远地区随机挑选出来的牧羊人。样本容娥通常约为丨500人。 
在这种大小的容贵上，误差幅度在 0.05 显著性水平上约为3%。意思是说， 
就意见测 M 而言，95%的样本，在正负3%的范围内，可反映出实际母体。因 
此，假设49%的实际人口打算投票给民主党候选人，那么， 95% 的样本将产生 
出在 4 6% ~52%这个范围波动的估计值。⑤ 

运用这种类型的样本预测总统选举时,一些主要的媒体公司一直有着相当 
辉煌的成就纪录，部分原因在于，他们一直很幸运，未抽到一个“异常”样本 （5 % 
中的其中一 个）， 还有一部分原因在于，他们的确对其样本进行了分层， 一定程 
度上避免了异常样本的出现。倘若仅利用简单随机抽样，异常样本就可能出 
现。这并不意味着，他们的预测就相当准确。1996年选举之前，哥伦比亚广播 
公司/《纽约时报》立即进行民意调査，结果过高估计了克林顿获胜的票额差数， 



⑤我们感谢 Albert Klumpp 提供这个例子。 



雳 5 # 变量和关系的瀏量 63 

高了 10个百分点。《时代周刊》断定，它的“可能选民”样本是不恰当的。® 

如果你试图利用某一样本来代表相互之间几乎无法区分的现实值，那么预测 
同样是困难的。2000年选举夜,一些主要的广播联通公司所运用的投票后民意调 
査的数据，导致他们对佛罗里达州的结果做出错误预测。佛罗里达州的一个问题 
在于，那里的投票结果相当接近——基本上是49%对49%。⑦由于这些广播联通 
公司呼吁佛罗里达州支持戈尔，所以他们的民意调査数据必定表明，戈尔至少 
领先1到2个百分点，因此可以肯定，他们的预测超出了误差幅度。⑧ 

2000年佛罗里达州投票后，民意调査过 分自信 地表示，戈尔比布什贏得 
更多选票，这一点导致他的失败。这并不意味着，有关谁会贏得选举的预测就 
是完全错误的。投票后民意调査测*的是，投票者在选举日想将选票投给谁。 
相对多数的佛罗里达州的投票者，可能的确想在选举日投票支持戈尔——但 
是，投票者的过失、设备故障，以及选举 结束后 非法地将海外选票计算在内，这 
些都搅乱了 M 终的计数，并且可能剥夺了戈尔当总统的机会。⑨即使将所有 
这些因素都考虑在内，这些 民意调 査还是过岛估计了那些自信已投票给戈尔 
的选民的比例。不管怎么说•戈尔和布什之间的（所获选票）真实差额就不到 
0-05 个百分点。一个极具代表性的样本应该已经表明了这一点，并且致使广 
播联通公司认识到，两人的选漀是如此接近以至于无法在广播中播出（一个 
明确的当选结果）。 

理解抽样的另外一种方式，就是思考劣质样本如何导致错误的结论。劣 
质样本在预测总统选举时曾导致一些严®的错误。一个现已停办的刊物《文 
摘》，由于每次选举都要对无数投票者进行调査，而且 （ 梢确地）预测了 1924、 
1928和1932年的总统选举，所以一度闻名遐迩。许多人将这些预测的精确 


⑥ 参见 Michael R . Kagay , " Experts See a Need for Redefining Election Polls ”，New York 
Times ( December 15, 1996), p . A 18。 

⑦ 在美国最高法院介人停止爾新计票以后，最终的官方合计数字表明，在佛罗里达州 
5 963 000 选民中，乔治 • 布什的得票高于戈尔 537 张，即贏得 4 8. 85% 的支持率。裉据这个合计 
数字，戈尔赢得明. 84% 的支持率。布什在佛罗里达州贏得了相对多数的选举团的选票。 

⑧ 投票后民意调査，通常会运用大的分层的因州而异的样本，这些样本降低了一些主要的 
媒体民意调査所使用的误差幅度的标准，即在上下 3 个百分点之间波动。 

⑨ 对未被计算在内的穿孔卡片、“悬挂式选票”、“毛虫式选票”、“蝶形选票”的选举后的审 
査，以及被非法计算在内的“海外*'选票，均表 明：在 佛罗里达州的选举中，想投票支持戈尔的人， 
要比投票支持布什的人多几千人。参见 Jonathan Wand et al , “The Butterfly Did It ： The Aberrant 
Vote for Buchanan in Palm Beach Country , Florida ”，American Political Science Review , 95 ， no . 4 
(2001): pp . 793-810. David Barstow & Don Van Natta Jr “How Bush Stole Florida ： Mining the 
Overseas Ballots " New York 7 Ym «( July 15, 2001). Kosuke Imai & Gary King , “Did Illegally Counted 
Overseas Ballots Decide the 2000 U . S . Presidential Election ?” Manuscript . Department of 
Government , Harvard University . 2001 0 
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表 5.1 税收和支 出：样 本偏差的影响 


问题 1 :你是 否相信，税收每增加1 

的支出？ 

美元.就应当出于赤字和债务削减的需要而节约两美元 


是(％) 

否(％) 

没有答案（％) 

《电视指南》回邮的回答 

97 

无资料 

无资料 

杨克维奇全国样本 

67 

18 

15 

问题2:是否应通过法律，以排除特定利益集团捐巨资给候选人的所有可 能性？ 


是(％) 

否(％) 

没有答案（％) 

《电视 指南》 回邮的回答 

99 

无资料 

无资料 

杨克维奇全国样本 

80 

17 

3 


注： “佩罗（无意）策动了一项民意调査实验，”引 fl David M . WHhur (公共 视点>(乂 0 1.4,#4©1993>第 


28-29 贞。洱版经过了公共意见研究中心的许可。 

性归功于庞大的样本容世。《文摘》从拥有小轿车和电话的人的列表中抽取 
—部分人，并用邮寄的方式对他们进行调査，然而，这种方法在20世纪20年 
代和30年代要冒很大的风 险：它 使得不怎么寓裕的人的比例过低。1936年， 
在对超过二百万的投票者进行调査之后，《文摘》根据其样本推断，阿尔夫 • 
兰登 （Alf Lamk > n ) 将击败总统罗斯福，因为兰登将获得 5 7%的选票。总统是 
兰登？取实并非如此。兰登在选举中仅获得36%的选票。应当强调，一个大 
的样本并不必然抵消无代表性。⑩ 

类似于分层随机抽样的技术已大大提高了民意调査的可 信度； 但是，候选 
人和利益集团所进行的调査，有时还会重蹈《文摘》的 榭辙。 请看表 5.1 所示 
的数据。在1992年总统竞选的过程中，独立候选人 罗斯. 佩罗 （ R oss Perot ) 
的集团，通过《电视指南》杂志将段意调査报告邮寄出去，并对读者做如下要 
求：当 他们观看某一候选人的电视演讲时，就在他们的选票上做出相应的标 
记。随后，读者的反馈意见被寄回佩罗集团。然而，当另外一个集团采取随机 
概率样本，并向应答者提出同样的要求时，他们得到的结果与佩罗集团报告的 
结果大相径庭。⑪佩罗集团的数据犯了样本偏差的 错误； 他们并未真正尝试 
随机化或分层化。因此，这种民意调査不可能成为民意的可靠代表。 


⑩1936年选举成就广乔治 • 盖洛普 （George Gallup ) 0 他用一个相当小的、相对随机的“定 
额”样本，预测罗斯福将获胜。至于对这次选举中的民意调査的说明.请参阅 David W . Moore , 
The Superpollsters ( New York ： Four Walls Eight Windows ’ 1992 )。 但是盖洛普 1936 年所使用的定 
额方式，却导致了另外一次有名的（预 测） 失败 :他的 样本导致他预测杜威 将在丨 948 年选举中击 
败杜魯门。自1948年以后，盖洛普和其他的民意调査人最终采用了槪率样本。 

⑪ Daniel Goleman , “ Pollsters Enlist Psychologists in Quest for Unbiased Results ， ” New York 

Tinies ( September 7 ， 1993) ， pp . B 5, B 8. 另请参阅 7 V Public Perspective ( Roper Center for Public 
Research ) ， May/June 1993。 
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表 5.2 常见的误差来源 


误差 

例子 

模糊 问题： 

你是否认为,我们应当为了和平或强大的国防而奋斗？ 

引起偏差答案的带有象征意味 

你是否认为，都市儿童有生命权？你是否认为，怀孕妇女 

的 问题： 

应当有权选择堕胎？ 

超出回答者信息范围的困难 

你是否赞同美国在与俄罗斯进行裁减军备的谈判中对于 

问题： 

弹道飞弹部队所持的立场？ 

不适合问题主题的回答 选项： 

你感觉未来会更好还是会更差？ 

包含不止一项议题的 问题： 

你是否更有可能支持一位赞同校车接送以及强大国防的 
候选人，或者更有可能支持一位个性讨喜的候选人？ 


应当注意的是，除了样本的代表性之外，其他误差来源也悄悄地在凋査研 
究中蔓延。某一研究者可能已经挑选了一个具有高度代表性的样本，但其测 
燉工具可能导致误导性的答案。常见的误差来源包括表 5. 2中列举的那些。 

除了这些明显的误差类型外，还有一些误差源自一种 困境： 你很难确定你 
在测®的东西就是你认为你正在测 fft 的东西。举个例子，我们想了解人们对 
穷人的个人同情心，出于对此的兴趣，我们提出这样一个 问题： 你是否赞同穷 
人在饥饿时偷面包的行为？对穷人抱有极强同情心的某个人，可能会说“我 
不赞成 "，因 为那个人在对穷人抱有极强同悄心的同时，还极其尊策法律和秩 
序。谘注意，这个问题并非没有意义，误差来源于把某种不恰当的意义赋予回 
答。除了预想的一个变歎（对穷人的态度）之外，这个问题还提出了另外一个 
供讨论的变掛——对法律和秩序的薛重。⑫ 

除了草率的测请所导致的误差之外，还有就是用来概括数据特征的统计 
程序所引起的误差。至少在一种较低的程度上，统计学往往会歪曲现实—— 
这也正是统计学家为什么更愿意运用多种技术槪括数据特征的原因所在，目 
的就是要避免单一程序所造成的偏差。 

测量变量间的 关系： 关联和相关 


关联 

确立两个或多个变量间的关联度，成为科学事业的核心目标。科学家花 
大量时间以阐明一个事物如何与另一事物相关，并将这些关系建构为说明性 


⑫对民意调查的一个通俗易懂的介绍，可参见 Herbert Asher , Polling and the Public ： What 
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的理论。 

与其他形式的测量一样，关联问题也经常出现在一般的谈话中，比如在下 
面这些话中 ：“有 其父必有其子 ”；“ 窥一斑而知全 豹”； “一 天一个柑橘，远离坏 
血病”。在从统计上测量变量间的关联程度时，科学家只是做名副其实的事 
情：将 司空见惯的行为严格化和精确化。 

有时可以用一些简单方式来概括关联的特征。一个变暈对另一变量的影 
响可以用文字或统计数字来描述。“用 Crust 牙音 的人，有更少的龋齿”这个 
陈述，表示了自变 S (用 Crust 牙骨刷牙） 和因变量（齲齿的数量）之间的关系。 

在对关联进行具体说明时，可以有效地使用诸如中位数、平均数及标准偏 
差这类描述性统计贵。例如，我们在第2章关于选举制度和投票人数的讨论 
中，每一国家中的选民参与的百分比大约可均分给三种不同类别的选举制度 
(见表 2. 2)。这使我们能分析选举制度对投票人数的影响，而且，百分比的差 
异还是唾手可得的比较手段。例如，我们在第3章关于社团成员身份和世代 
之间关系的讨论（见表 3. 3 ) 表明，在锻年轻的年龄群中，只有22%的人是三个 
或更多团体的会员。倘若年龄段和团体成员身份之间不存在任何关系，那么 
我们可能会以为，在每一年龄段中，都仅有22%的人加入三个或更多的团体。 
唞实并非如此。在老龄群中，31%的人加人三个或更多团体——二者之间差 
了 9个百分点。 

在这一点上，我们可能会问, 9 %是否是一种足够大的差异，以至于我们可 
以说，年龄段和团体成员身份之间存在某种关系。在这种情况下，答案是肯定 
的。关于关联和相关的测用:，为我们提供了回答这些问题的工具。⑬ 

关联和相关的_量 

为了特定的应用，统计学家已经发展出更为精致的工具，以阐明变被间的 
关系： 关联和相关的测里。不同层次的变 M 测 M ， 需使用不同的统计方法来对 
关联进行测试。其结果就是一碗关于测试的字母汤 （alphabet soup ), 它通常 

由希腊字母表中的字母标示，例如，•和 c / ro 。 所有这些测试总是共有某种通 
用的逻辑。 

关联和相关的测量，通常被作为一种统计问题加以研究，在此，我们将集 
中讨论它们背后所隐藏的观念。当你看到某一相关统计量时，我们的讨论应 
该能帮助你认识到它。要理解算法和限制性假定，你可以参考统计学教材。 

相关的基本观念，就是在统计上描述变量间的关联。假定所有其他条件 
都一样，那么，关联测量就可以概括彼此相关的两个变量的动向。 

⑬在表 3. 3 中，假定一个样本的容量为 14 259 •样本中数据的卡方值为 1 50 . 〗，那么这个样 
本将表明，群体会员数不依赖年龄群这种情况的发生槪率相当低。 
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变量 A 和变量 B 之 
间的相关可以完全 
預测： 随昔 A 的变 
化. B 以相同的方 
向变化。 


变 SA 和变 ftB 之间的 
相关完全无法 预测： 
当 A 朝某一方向变化 
时， B 可能朝任一方 
向变化。 


变 MA 和变量 B 之间 
的相关珥以完全预 
测： 当 A 变化时 ， B 
以相反方向变化 n 



当 A 变化时 ， B 今 A 变化时，向 

总体上以相同 于以相反的方向发 

方向变化。 生微小的变化。 


图 5.2 相关量表 


相关分析作为一种进步，突破了百分比差异的比较，因为它允许你根据单 
一统计«来了解关联的 方向和数量。 方向指的是关联是正的还是 负的。 随宥 
变® a 的增加，变 a b 也增加，这时，二个变《间就存在一种正相关。也就是 
说，变 M A 随苕变 用: B 的上升而上升（反之亦 然）。 随狞变贵 A 的变化 ，变® 
B 朝相反方向变化，这时，两个 变世间 就存在一种负相关。在负相关的情况 
下，随若 A 的增加， B 减少（或者，随狞 A 的减少， B 增加）。 

举个例子，一个气球中氦分子的数蟥与气球上升速度之间就存在一种正 
相关。上升速度和附在气球上的 mw 之间则存在一种负相关。正/负相关，用 
相关数字前的“ 或“表示。 

相关强度用数值大小表示，这些数值的取值范围是从0到 + 1 . 00或从0 
到-1.00。相关撤表，可参见图 5.2 的说明。因此，相关统计提供了变 M 间关 

系，以及关 联测® 的简单指标-种可能具有危险性的简单方法，因为这些 

统计数字背后的数学运算牵涉到需要谨慎思考的假定。除此之外，计袢关联 
测粗 •的各种技术，也会导致结果稍微偏离真实的数据。了解相关运算的一般 
技术，将使你能够看出一些（尽管不是全部）问题。尽管如此，在不完美的测 
M 界，这些统 计最仍 然是有价值的工具。 

用以计算关 联测童 的技术因所运用的不同测量层次而变化。如果在名目层次 
上测量 两个变最（单纯的分类），那么，相比在区间层次上测*两个变贵的情况而 
言，就很少可以对关联的特征进行槪括。事实上，对每一种测 贵层次 而言，都存在 
可供利用的相关技术，我们将对这些技术如何起作用进行一般的说明。 

名目层次上的关联。 名目测«只涉及简单的分类，是低等级的测量，而 
且与其相称的关联测鼉实际上不应当被称为相关。列联系数是一种统计 
量，通常用来槪括数据的实际分布在多大程度上偏离两变量无关联时 
的分布。 

假设一位研究者想检验一部古老的斯蒂夫 • 马丁 （Steve Martin ) 的电影 
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片名所陈述的主张—— 死亡男人不穿彩格衣。 为了透彻地检验 ，他决 定检验 
死人和活人穿彩格衣的相对发生率，以观察死者是否确实有差异——就男式 
服装而言。这位研究者观看了二十份男性活人的样本，并在当地殡仪馆察看 
了二十具男性尸体。如果结果表明，死亡男人和活着的男人，穿彩格衣的情况 
一样常见，那么马丁的假设没太大价值。 

表 5. 3呈现了一组结果，这些结果表明，穿彩格衣与男性的状况（无论是 
死者，还是活人）之间并没有关联。这正是我们可能看到的情况，倘若两个变 
M 间没有关联的话。数据显示，24个穿彩格衣的男人，均分在活人和死人之 
间。同样 J 6 位不穿彩格衣的男人，在活人和死人的分布也是一样多。在这 
种情况下，列联系数将是0。 

但是，假设我们实际上观察到其他不一样的情况。假设死者和活人当中， 
穿蒋彩格衣的男性的数世存在差异，结果又会如何？如何用精确的统计术语 
来表达呢？ 

列联系数的计算是根据以下两种数据分布的比较得来的： （ 1 ) 如果变撤 
间不存在关联，我们预期观察到的值（表 5. 3); (2) 我们实际上观察到的值 
(表5. 4 )。表 5.3 的结果，可以表达 为卡方 （ chi - square ) 统计擞，或列联系数。 
由于卡方没有上限，所以出于解释的考虑，它通常被转换为类似于列联系数的 
统计世，较大的值反映较强的关联。如果我们发现，数据分布的确如表 5. 3所 
示，⑭那么，卡方值就等于 8. 12,列联系数将是0.41。这些统计贵指出，死亡与 
穿狩之间存在某种关联——但并非电影片名中所指出的那种关联。相比活若 
的男人而言，穿彩格衣的死亡男人的比例似乎吏大。 


表 5.3 穿彩格衣的预期发生率 


穿着类型 


男性的状况 

it 


彩格衣 
非彩格衣 



穿着类型 



穿彩格衣的实际观察到的发生車 

男性的状况 

ft# 


m 5 m 变 m 和关系的瀏量 69 


用更系统的语言来说，这种数据分布指出，死者和穿着特定格调的衣服 
(在此例中，就是彩格衣）之间存在某种关联。列联系数被用来概括非排序性 
的、名目层次的变量间的关联。⑮这个测童值在 -1.0 到+ 1.0 这个范围内变 
化。记住，负统计量表明，随着一个变量的增加，另一个变量便会减少（反之 
亦然）。正统计最意味着，两个变量朝着相同方向变化。对变最中的类目进 
行排序的同时又进行分类，当这种可能性存在时，确立真正的相关性就成为 
可能。 

顺序层次的相关。 “顺序”意味着排序。这一特征为顺序层次上计算的 
统计童 提供了基础。我们可以根据事例依照两个变量的排列顺序来比较它们 
的等级。举个例子可能有助于说明这一点。 

设想，160名童子军组成的一个团体，高唱着“上帝保佑美国”。领唱者 
(一个马克思主义者）按照歌者的音乐才能，将他们从最好到最差的顺序划分 
为 四类： 金丝雀、知更鸟、麻雀和乌鸦。他打算检验他的信 条：下 层大众比贵族 
阶层唱得更好。 

因此，他可同时使用两种顺序分类法 ：根据 金丝雀、知更鸟、麻雀和乌鸦， 
对 音乐才 能进行 排序； 根据上层、中上层、中下层和下层，对 阶级进 行排序。他 
打算检验的假说 就是： 社会经济阶级与音乐才能之间是否存在某种关联。那 
个领唱者假定，下层阶级的人比上层阶级的人唱得更动听。 

如果上述假设为真，那么，数据将表明一种特定模型。随符阶级的上升，音 
乐才能将下降。下层阶级的人，将集中分布在“金丝雀”这一类别，而上层阶级 
的人集中分布在“乌鸦”这一类别。假定他所发现的数据分布，呈现在表 5. 5中。 

从这些数据看，这种关系不是十分淸楚，但是我们可以看出，下层阶级的 
童子军有一种显著 倾向： 他们的歌声比“上等人”的歌声更悦耳。现在，我们 
® 要一种有助于确定关联度的统计歷。除了其他类似的统计 M 之外，古德曼 • 
库待斯卡 （Goodman Kruskal ) 的伽 玛运用一种有意思的逻辑演算来概括关联 
度。 伽玛反 映的是 ：已知 自变燉（阶级）的等级分布，在预测因变 M (音乐才 
能）的等级分布时误差减少的比例。如果某人的阶级地位不折不扣地预测了 
其歌唱才能 ，伽 玛就会 很高； 若非如此 ，伽 玛就会很低。 


表 5.5 音乐才能与社会阶级 


才能 

上层阶级 

中上层阶级 

中下层阶级 

下层阶级 

金丝雀 

0 

0 

5 

30 

知更鸟 

0 

10 

20 

10 

麻雀 

5 

15 

15 

0 . 

乌鸦 

35 

15 

0 

0 


⑮其他以卡方为基础、在0到1这一数值范围内、在名目层次上评估所测景的变量间关联 
的统计量是克拉马的 v 系数和 phi 系数。 
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回到这个假说 ：当我 们提高阶级的等级时，数据是否表明，音乐才能的等 
级也相应的下降？在表 5.5 中所呈现的数据中，伽玛将是-0.93。这意味着， 
如果我们知道一个人的阶级，它将使我们预测此人音乐才能等级的能力提高 
93个百分点（相比我对这个人的阶级地位一无所知的情况下的预测能力而 

言）。这一点是否证实这个假说？是的。阶级层次和歌唱才能之间存在一种 
负关联。 

区间和比例层次的相关。 为了进行区间或比例测童，你必须能够确立分 
析单位之间的距离。根据金丝雀、知更鸟、麻雀和乌鸦将歌手排列起来，这还 
不 够好； 金丝雀与知更鸟之间，以及与其他类别之间的距离极必须得到具体说 
明。金丝雀和知更鸟之间歌唱才能方面的差异，可能与麻雀和乌鸦之间的差 
异完全不同。随肴距离的阐明，我们便有可能运用一种相关统计摄，它可以利 
用距离因数来测 M 变撤间的关联。 

区间和比例测贵允许我们使用一种出类拔萃的 统计馈 ，它被命名为皮尔 
逊积差相关系数，或皮尔逊相关系数。 

为了化繁为简，我们将编造一个相当基本的例 子：私 有油井数揪和卡迪拉 
克的数所之间的关系。我们的“样本”由5位拥有油井的业主组成 。为了弄 
淸楚皮尔逊积差相关的数学运算可实现什么，我们来考虑两组可能的数据。 
首先，假定油井数坩和卡迪拉克数故之间存在 + 1.()0 的相关。我们可以宣 
称，图 5. 3所说明的两组数据，同样具有 + 1.00 的相关。 

请注意，图中所划的连接每一事例的实线表示两个变贵间的如下关 系：油 
并每增加一口，卡迪拉克便增加两辆。假如这条直线在一个不同的水平面上 
歼始 " F 落，便可得到完全相关的 结果； 例如，清肴那条虚线。它表明，你在没有 
油并的情况 F ，也可得到一辆卡迪拉克，但是，每额外 if } 加一辆卡迪拉克，似乎 
就有必要挖一口新的油井。 

现在，我们设想这样一组数据，在其中，事例并未出现在一条直线上。倘 
矜数据分布确如表 5. 6和图 5.4 所示，我们便无法划出任何一条直线来连接 
所有亊例。假设存在一条直线，它最接近图中各点，亦即，它将所有事例偏离 
这条线的离最大限度地缩小。通过一种数学处理，皮尔逊相关系数可以认 
定，—'条表不线性关系的想象直线周围，点群 （points cluster ) 霜近该线的紧密 
程度。由于数学上的原因（最好留给数学家），事例与这条线之间的偏差，根 
据距离的平方 U 2 + d 2 ) 来计算，而非单纯的距离之和 （ a + b + c + d ) 0 

事例与最恰当的那条线之间的距离越远，变量 A 与变虽 B 之间的相关度便越 
低。就图 5.4 来说，皮尔逊相关系数为 +0 . 85 。 

一皮尔逊相关统计可以被用来提供另外一条重要信息。对皮尔逊相关系数 
进行平方，我们就可发现，自变 M ； 的变化所解释的因变量的所有变化的比例是 
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油并的数童 油并的数 tt 

图 5. 3 图 5.4 

多少。以图 5.4 中油井和卡迪拉克之间的关系为例，皮尔逊相关系数 （ r ) 是 
+ 0.85, 所以 r 2 就是 0.72(0. 85 x 0.85)。 因此，某人所拥有的油井数，可解释 
72%的私有卡迪拉克数 M 。 其他变 M 则解释剩余28%的变化。 

另外一种可能，假设所有点都落在这条线上（如图 5. 3所示）且 r = +1.00, 
那么 r 2 还是等于 1.00( 也就是说，1 xl =1)! 油井数 S 与卡迪拉克的数《完 
全相关，并且没有任何变化需留待其他因素解释。 

就此处所讨论的每一种关联测*而言，皮尔逊相关系数 （ r ) 告诉我们的 
是相关，它可能也可能不暗示某种因果关系。具有显著性的 r 并不表明，油井 
数导致人们拥有更多的卡迪拉克，仅仅表明，这两样东西是结合在一起的。实 
际关系可能是颠倒的（尽管在这个例子中，这一点似乎不合逻辑）。我们可能 
发现两个事物是相关的，但对哪一 个变锹 决定另一个变 量， 并没有明确的想 
法。假设一位研究者发现，教育上的造诣与智力相关。那么，哪一个导致另一 
个呢？关联测®,并不需要研究者对因果关系做任何假定。统计学并不确立 
因果关系； 因果关系取决于关系的逻辑 （见表 4. 4)。 

请注意，这套程序并不实现其他东西。皮尔逊相关系数为+ 1.00,这仅仅 
表明， A 的任何变化都与 B 的一致变化有关。它并未向你表明， B 随着 A 的变 
化而发生相关变化的单位数量是多少。在图 5. 3( 实线）所示的例子中，所发 
生的情况的确是这样 的：油 井每增加一口，卡迪拉克便增加两辆。但是，假设 
情况是这样 的：油 井每增加一口，卡迪拉克就相应地增加1辆，或1/2辆，或3 
辆，这样一来，仍可得到+ 1.00 的结果。 
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表 5.6 油并和卡迪拉克 


卡迪拉克的数 M 


油井数 


—P 

二口 三口 四口 

五口 

-辆 


1 


两辆 


1 


三辆 


1 


四辆 


1 


五辆 



1 


用数学术语来说，皮尔逊相关系数仅告诉你一条想象直线周围的事例分 
布。它并未告诉你这条线的斜率，换言之，它并未告诉你， A 每变化一个单位， 
B 的变化量是多少。一种涉及先进统计槪念的不同的统计程序，即所谓的回 
归分析，处理这个问题。 

回归分析 


这种普遍类型的测 K 方法& 在刻個 i 变坩间 的相互影响。回归分析为这些 
特征增加一种新的梢度。借助回归分析，如果你知道一个自变®的值，你就可 
以幵始预测 因变敏 的值。 

有两种基本的回归类 型：双 变量回 归和多 重变量 回归。与相关分析一样， 
双变耿回归阐明，单一自变 M : 的变化程度如何与一个因变 M 的变化相关。多 
重回归考察的是，若干不同的自变《如何与一个因变世发生关联。 

作为双 变贵回 归的一个例证，我们来思考职棒大联盟的一个简单例子。 
既然职业槔球队在球员工资方面开支不同，我们可能想了解，高额支出是否与 
球队的最终排名相关。球队薪金总额对胜率有多大影响？双变*回归根据下 
列线性方程式，概括出两个 变撤间 的关联，可帮助解答上述问题。 

y [胜率 ]= a + [球队薪金总额] 

用文字来表达这种关联，就是说 ：变最 y (球队 胜率） 的值，是某一常量加上一 
定数撤的变贵 X 的一个函数。我们感兴趣的问题是，球队支付给队员的薪金 
总额是否影响到它在赛场上的成功。换言之，变景 H 胜率） 的变化，有多少与 
变量 球队薪金总额） 一个单位的变化相关联。 答案 取决于6,即回归 
系数， 

我们可以运用2002年棒球赛季的资料来检验这一假 说:较 高薪金总额的 


⑯用代数术语来说,6代表 A ： 和 f 之间关系的斜率。将代数与棒球结合起来，若我们将 y 
与 X 的关系绘制在图表上，那么6就是“纵距与横距之比”。 
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球队将贏得更多比赛。©针对30支不同的大联盟球队，我们所测量的 球队薪 
金总额 （变量尤）是一支球队付给每位队员的平均工资，以百万美元为单位。 
我们所测最 的胜率 （变景 D 是这支球队在2002赛季获胜场次的百分数。这 
两个变最间的皮尔逊相关系数是0.60,这表明，球队花费的金钱越多，它们贏 
得比赛的场次也就越多。双变*回归 表明： 

球队获胜百分比 = 36 +6. 1 x 球队薪金总额（以百万美元为单位） 

这意味着，一支球队的薪金总额和获 胜百分比之间 关系的斜率是 6. 1。 
这一结果的显著性水平是0.01。换句话说，平均每付给一位队员一百万美 
元，一支球队蠃得比赛的场次就会增加6个百分点。一个常规的棒球赛季下 
来，这支球队将多廠得大约10场比赛。 

这些结果表明，一支球队平均付给每位队员三百万美元，那么，我们就可 
以预测，这支球队将廠得 54. 3%的比赛 （36 +6. 1 x 3 000 000美元 =54. 3%， 
或者一个 0.543 的纪录）。我们还可以表明，任何一支特定球队，如若想将其 
获胜吖分比提商10个百分点 （36 +6. 1 xl 640 ()00 美元=10.004% ) ，就必须 
付给每位队员丨600 000多美元。⑬ 

以球队薪金总额为基础建立获胜百分比的模型，可解释幣个 30 支大联盟 
球队获胜百分比中36%的变化。这意味翁，其他变馱——老练的经理、实力 
很强的投手、报酬不是很多的有天賦的年轻人，以及其他—些不太好捉摸的变 

疳-在解释为什么一些球队获胜，而另外一些球队失败时，可能更有说服 

力。⑬这个例子表明了我们有时候在社会科学中发现的一个要 点：我 们的回 
归模型尚有大 S 有待解释的地方，因为我们所模拟的一些东西，可能是一些无 
形因素的结果，这些无形因索很难被揪化。 


⑫球队最终排名的数据来自 http :// www . mlb . com 。 球队薪水的数据来自 http ：// www . 
sport ingnews . com 0 

捧球作家保持宥一种奇怪的 传统: 根据“百分率”来报道一个队的纪录，事实上，当他们这样 
做时，他们实际描述的是比例。也就是说，当一个队的胜率超过 “0.500” 时•这个队才算获胜。 
我们的数据作为真实的百分比被记录在案，所以获胜也就意味着纪录超过 50 . 0% 。如果我们将 
比例 （ 而不是百分比）融人我们的分析中，那么6就要用比100次更小的单位来表示。 

⑱ 轴截距 的常数 (36%)代表的是：如果是0,那么 F 的值将是什么——在这个例子 

中，代表的是一支由优秀业余球员所组成的一支未付报酬的球队能够在一个赛季贏得比赛的百 
分比。 

⑲对这个例子而言，由于皮尔逊相关系数为0.60,所以我们知道，开支解释了球队胜率中 
36%的变化 (0.60 x 0.60 = 0. 36)。 /■’ 所代表 的模型拟合度 为什么正好是 0. 36,一个原因就在 
于，薪金总额低于平均数的大量球队在2002赛季都有最好的纪录 （the Anaheim Angels and the 
Oakland A ’ s ), 但是几支薪金总额较高的球队，其纪录却很糟糕 （出 e Texas Rangere and lhe New 
York Mels ) 0 



74 社会科学研究的思维要素 


我们来思考另外一个例子。在附录 B 中，大卫 • 布罗金顿 （David 
Brockington ) 、托德 • 多诺万 （Todd Donovan ) 、肖恩 • 鲍勒 （Shaun Bowler ) 、 罗 
伯特 • 布里斯切托 （Robert Brischetto ) 探究了下述 问题： 一种新型的地方选举 
制度如何能够导致种族性及民族性的少数族群的代表性。在标准的美国“赢 
者通吃”式的选举规则下，非洲裔美国人和拉美裔美国人通常很难有机会被 
选人市议会和学校董事会。即使是在少数族群占社区总人口的30%或40% 
的一些地方，一旦白人候选人获得相对多数票，并贏得所有在全市范围内竞选 
的“不分区”席位时，少数族群的代表也会被排除在外。在此，研究问题直截 
了 当：在 替代性的“累积投票”制下，非洲裔美国人和拉美裔美国人贏得的席 
位，是否与他们在社区总人口中所占的份额成正比？ 

由于只有少数美国社区直到20世纪90年代才采纳累积投票制，所以就 
这个问题先前几乎没什么研究。这项研究的发起人注意到，从理论上看，尜积 
投票制理应产生少数族群代表，其比例大致与他们在某一城市的总人口中所 
占的份额成正比。 ® 先前研究已证明，比例性可以根据下列方式得到评估，即 
运用双变《回归来研究下述两 个变鳅 间的 关系： 其一就是社区中少数族群居 
民的百分比 （ 自变 M , 或 X );其二就是少数族群所占据的议会席位的百分比 
(因变《：，或 H 。 

这项研究的发起人发现，对于那些少数族群是非洲裔美国人的地区而言， 
两变《间关系的斜率是 0.95， F 轴的截距几乎等于 0( 见附录 B 的表2)。这意 
味捋，在使用累积投票制的地方，非洲裔美国人的人口每增加1个百分点，他 
们所占据的议会席位的比例就相应地增加 0.95 个百分点。换言之，代表性接 
近于比例性。在附录 B 的图1和图2中，这种关系以图解的形式呈现出来。 
这些发起人将他们的结果与其他的关于少数族群代表性的回归分析的结果进 
行比较。通过比较，他们指出，在美国南部，相比于运用同一种族选区为基础 
的选举制度而言，这些新的累积投票规则甚至会产生更多的少数族群代表。 

当回归牵涉到一个以上的变最时，将会如何（直接与政治相关的一个例 
子又会如何？）。举个多重回归的例子，假设你注意到，在选举政治方面，你朋 
友的参与度差异很大。活跃性可能涵盖此处举例说明的 范围： 

非投票者 偶尔投票者 政党活动家 

为什么一些人比其他人更活跃？在行动主义之前（或独立于行动主义） 
所发生的因素，可能包括收人水平、教育程度或先前对政治的经验水平（称它 
们为自变量）。每一种因素在逻辑上都可能与积极性程度相关。多重回归可 


⑳在累积投票制下，投票者玎能会投出与竞选席位一样多的选票。如果4个席位有待选 
举，那么某人可能会 4 次投票支持一位候选人，或者一次投票给4位候选人，等等。相关讨论，请 
参阅 Lani Guinier , Lift Every Voice (New York ： Simon & Schuster , 1998) 0 



第 5# 变量 和关系 的澜量 75 


以同时分析若干自变量的影响。这种技术将单一自变最的影响分离出来，而 
同时又限定 （ 或使其保持不变）其他自变童的影响。 

为了继续考察这个例子，我们从一个人所参与的政治活动（包括投票、竞 
选、捐助候选人、参与抗议或示威，等等）的数量中得出一个分值，根据得分的 
多少，我们就可以对政治行动主义（因变量）进行具体操作。参与的活动越 
多，参与得分也就越高。简单起见，我们姑且假定，我们对政治行动主义的测 
最值 ，在0到10这个范围内变化。 

如先前所见，相关测 tt 使我们得以了解到，（比如说）收人和政治参与之 
间是正相关还是负相关（随着收入的增加，参与是上升还是下降），而且，相关 
还可以确立，一个变》如何紧随另一个变唐而变化。 

在对收人和参与之间的相关有所了解的情况下，你可以估计出，相比穷人 
而言，富人是否在政治上更积极。但是，假如你想拥有更高的几率来预测参与 
的变化世与收人水平的一个单位的变化之间的关联，就需要回归分析。在对 
一个或多个额外变 M 的影响进行限定的同时，若想检验一个自变財对一个因 
变用:的影响，就需要多里回归。 

例如，我们可能料想，政治行动主义的变化同时与收人及教宵相关联 。多 
電回归从统计上估计每个变*对因变 fft 的单一影响而同时使其他自变世保持 
恒定。因此，在限定收人水平的同时，我们可以了解教育是否影响参与。多歌 
回归表格通常会标明所分析的每个自变*的&值（斜率或回归系数）。它们 
可以被解释 为：在 其他被包括进来的变 ift (弋，义等）保持不变的情况下，与一 
个自变燉 U ,) 的一个单位的变化相关联的一个因变馕 （ F ) 的变化俄。 

回想一下，我们在第4章关于控制和虚假性的简短讨论。社会科学家经 
常无法运用实验室来控制或使 多敢变 1：的影响“保持恒定”。例如，将特定收 
入水平和教育程度随机分配给不同的人，然后将他们置于观察中，并等着观察 
参与是否以不同的比例出现在具有混合收人和教育水平的人们当中，这样做 
不仅不可能，而且也是残酷的。基于上述原因，社会科学家通常 测贵现 存的现 
象，然后运用统计程序 （ 比如多重回归）来控制那些无法（或不应该）被操纵的 
变最的影响。 ® 

当自变 M 根据不同单位得以测量时，对多重回归系数的解释可能会变得 
很复杂。由于收 入测董 （美元）的范围远比教育测量（上学的年限）的范围要 


㉑ 处理回归的数学演算超出本书讨沦的范围，但就这一主题，有无数的教材可供参考。简 
洁易慷的介绍，可参阅 L . Schroeder , D . Sjoquisl , and P . Stephan , Understanding Regression 
Ana … k ， Sa « e University Paper Series on Quantitative Applications in the Social Science , no . 57 
(Beverly Hills ， Calif . : Sage Publications , 1986)； 另参阅 M . Lewis - Beck , Applied Regression , Sage 
University Paper Series on Quantitative Applications in the Social Science , no . 22 (Beverly Hills , 
Calif . : Sage Publications f 1980) c 
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广，所以很难就这两个变量的回归系数进行比较。但是，一种统计技术可使它 
们具有可比性。比较单位可以用标准偏差单位表示。 

“常规的”变量分布，大约2/3的观察值会落在中位数上下一个单位的标 
准偏差范围内。最远端的分值，位于中位数上下两个或三个单位的偏差范 
围内。 

若一个变贵有大 tt 事例位于变化量的最高与最低端，那么，无论变化范围 
有多大，该变 M 都将具有较大的标准偏差。若一个变量的分值都集中在平均 
数周围，它将具有较低的偏差。这种将偏差标准化的方法，通常被用于回归 
分析 。® 

随之而来的标准回归系数一般指的就是贝塔系数；与皮尔逊相关系数一 
样，它通常在 -1.00 到+ 1.00 这个范围内变化。就我们例子中的因变 M (政 
治行动主义）而言，如果我们发现，收人的贝塔系数是 + 丨.00,那么这将表明， 
收人的一个标准偏差单位变化与参与的一个标准偏差单位变化相关。如果我 
们发现，贝塔系数是+0.50,我们就可以推断，收人的一个标准偏差单位变化 
与参与的半个标准偏差单位的变化相关联。 

回归系数和贝塔系数是回归分析的一个组成部分。另外一部分是多電相 
关统计 tt ，即尺（不要同皮尔逊的小写的 r 混淆，小写 /• 处理的是单一自变 ® 的 
问题）。尺指明一组自变 佾和一 个因变 M 之间的相关。与 r 一样，我们也可以 

对尺进行平方，尺 2 表示，由所思考的一组自变*所解释的一个因变畎的变化 
比例。 

总而言之，如果我们运用计算机统计软件包，就收人和教育对政治行动主 
义的影响进行多里回归分析，那么，我们的结果将包括 每—个 自变贵的 & 值和 
beta 值， 而且还包括炉，它描述了所有自变 M 的影响。在我们的例子中，由于 
我们有两个自变 M ， 所以我们就会有两个独特的6或斜率，且有两个独特的 
beta 。 6 用什么单位表示，因变《就根据什么单位测贵。因此，假设教育的6 
值为 0. 25,这将意味着，在收人的影响保持不变的条件下，教育每发生一个单 
位的变化，政治行动主义的分值就将提高 I / 4 点。假设教育的值为 0. 10, 
这将意味着，教會的标准偏差每提高一个单位，政治行动主义就会增加 0 10 
个标准偏差单位。如果/? 2 =0. 56,我们便可得知，这两个变量所解释的政治 
行动主义测《的变化刚好超过一半。 

我们对已经提出的这些关于测最变贵间关系的统计量进行了一个归纳， 
并以此展开下面的议题，请参见表 5. 7。 


…， ㉒ 运用，准回归系数带来大最技术上的问题。一些学者建议，研究发现应当只根据“真 

实”单位来表不。参阅 Gary King ，** How Not to Lie with Statistics, w American Journal of Political 
Science 30 f no . 3 (1986 )： 666^687 0 
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表 5.7 关联、相关和回归的测置 

统计最 • 意义 

r 皮尔逊相关 系数： 两个变 M 间的共变度 （-1.00 〜 +1.00)。 

r 2 决定 系数: 在双变 tt 回归中，自变 tt 的变化贵所解释的因变 量的变 化比例 

(0- +1.00)。 

R 多重回归系数 •.与两个或多个自变最的变化相关联的一个因变最的共变度 

(0 〜+1.00)。 

R 2 决定系 數：两 个或多个自变量的变化所解释的一个因变 ft 的变化比例 （0 〜 

+ 1.00)o 

b 非标准回归系 数：自 变最每发生一个单位的变化，一个因变量所发生的变化 

M(o - * ) 0 

b^ta 标准回归系 數:一 个或多个自变 ft 每发生一个单位的变化 ，一 个因变唐的变 

化总贵，其中，所有变世的单位都可以根据平均数之间的标准偏差进行比较 
_ (通常在_1.00~ +1.00 之间变 化）。 _ 

* 出于本表需要，我们把皮尔逊相关系数作为唯一的相关测贵来使用。至于其他测话，参见本章注②。 


为什么要多重回 I 月 

控制和虚假性 


在其他自 变嫩的 影响保持不变的同时，你如何确定某个自变进的独特影 
响？多 重回归 分析就是这个问题的答案。 

请回顾第3章的讨论，研究社会资本的学者对以下这个问题感兴趣 ：自愿 
团体的会员身份，如何与政治参与相关联。在附录 A 中，罗伯特 • 普特南所 
提供的证据表明，低程度的团体会员身份与高程度的电视观看相关联。他写 
道：“ 即使在对教育、收入、年龄、种族、居住地、工作状况和性别进行限定以 
后，电视观看与社会信任及团体会员身份之间还是具有很强的负相关关系。” 

附录 A 的图 AT , 对以下这一点提供了一种直观说明 ：社会 科学家如何检 
验，一个变贵对另一个变量的独特影响（在这个例子中，就是电视观看对团体 
参与的影响）在别的变量的影响被考虑进来时是否保持原样。根据普特南所 
提供的例子，我们可以发现，在各种教育程度上，看电视最少的人加人的团体 
也就最多。换言之，即使我们对教育的影响进行限定以后，电视观看和团体参 
与之间的负相关关系，还是保持不变。 

为了解释美国社会资本的下降，普特南打算单独“揪出”一个变童，将其 
作为首要的嫌疑对象。在附录 A 中，大董证据表明，电视是“罪魁祸首”。通 
过对许多可能的竞争性说明的限定，他得以做出一种较强的断言 ：电视 的有害 
影响不能归因为另外一种尚未说明的 因素。 这就是虚假性问题。 
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如果一项结果可被其他某个变 M 所解释，那它就被认为是虚假的。虚假 
关系的一个经典例子就是，火灾现场的消防车数量与火灾所导致的损失量之 
间的高度相关性。结论似乎很 简单： 增加消防车造成更多损失！被遗漏的一 
个变量毫无疑问是火势大小。较大的火势会引来更多的消防车，也会造成更 
大的损失。 

回到社会资本的问题，倘若频繁看电视的人就是这样一些人，他们几乎没 
有任何时间或精力加人社会团体，那又会怎么样呢？情况可能是这样的 ：许多 
人现在要工作更长的时间，或者在往返途中要花去更多时间。当他们回家时， 
时间可能已经太晚了，以至于碰不到任何团体。倘若真是如此，他们最终也只 
好通过看电视的方式来打发夜晚时光。从这种观点看，电视观看并不是导致 
美国社会资本下降的首要原因。相反，它可能意味着另外一个重要变请（即 
缺少自由时间），而这个变 M 才导致了人们放弃加人社会团体。 

任何科学事业的一个根本目标，就是对其他一些变最进行限定，这些变撤 
可能会通过解释消除某一重要的结果。在你本人的研究中，你可能不运用先 
进的统计或实验室的实验限定某一个或所有被遗瀨的变掛，而这些变贵也可 
解释你的观察结果。尽管如此，你还是应该考虑一下，你如何确信，你的结果 
不是虚假的。 


表 5. 8法官种族对量刑严重性以及判处监禁的彩响 


判处监禁 


量刑严 f 性 


MLE/SE 


beta 


所有被告 
没有限定 
限定被告和罪行 
限定法官、被告和罪行 
白人被告 


I. 10 


0 . 


2 . 10 # 
2. 17. 
1.67 


-0.48 

-0.91 

- 1.22 


- 0.01 

- 0.02 

-0.03 


-0.67 

-1.60 


没有限定 
限定被告和罪行 
限定法官、被告和罪行 


◦•11 0.92 0. 27 

0.35 2.19* 1.40 

0. 35 2. 18 # 1.39 



0.04 

0.04 


0.20 

1.31 

1.30 


黑人被告 
没有限定 
限定被告和罪行 
限定法官、被告和罪行 


0 . 10 
0.09 


1.72 
1.24 
0. 78 


•0.80 

-1.59 

- 2.00 



編 码:黑 人法官=1,白人法官=0。对被告和罪行的限定包括罪行严重性、无论被告是否认罪悔改、被告 
的前科，以及被告是否有公设辩护人。对法官特征的额外限定包 括:诉 讼经验、性别，以及任法官的年 
限。对所有被告、所有白人被告以及所有黑人被告而言, /V 分别等于3 418,763,2 655。 

• =显著性水平为 (K 05。 

注: MLE 就是极大似然 估计; SE 就是标准误差。 

来源： Su 8 an Welch , Michael Combs , and John Gmhl , 44 Do Black Judges Make a Difference ?" American 
Journal of Political Science 32 f no . 1 (1988)： 126-136. 
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为了更深入地讨论，我们来看另外一个例子。表 5. 8取自威尔奇、坎布斯和 
古尔 （Susan Welch , Michael Combs , John Gruhl ) 所进行的一项研究。他们探究 
了这个问题——“黑人法官是否有影响？ ”他们考察了影响主审法官量刑裁决的 
一些因素。这些研究者想知道，白人法官对待刑事被告的态度是否与黑人法官 
有所不同。这里的研究问题很明确••量刑裁决是否受影响于法官的种族？ 

先前研究不具有决定性——不同的研究发现了相互矛盾的结果。这项研 
究的发起者注意到，先前的研究者未能限定一些重要的自变量，比如，刑事被 
告的罪行严重性、被告的前科，以及法官的其他特征（如性别）。 

威尔奇等人在东北部的一个大城市中，从 1968—1979 年间被判处犯有重 
罪的男性被告样本中发掘出他们的数据。在其中一部分分析中，他们将因变 
畎操作化为法官*刑的严重性。他们使用了严重性《表，在其中，零相当于缓 
期 执行； 较低分数代表罚款和保护管朿；较高分数代表监禁服刑时间；最高为 
93分，相当于终身监禁。因为他们想对多个自变撖进行限定，所以他们运用 
多重回归分析。 

运用某一类型的双变值回归，他们发现，法官的种族 （ 自变撤）与判决严 
欺性并没有关联。也就是说，当他们仅仅葙眼于法官的种族和撤刑严敢性之 
间的关系时，他们发现，二者之间并没有关联。 ㉓ 但是，当他们运用多重回归 
并且对被告罪行的严®性以及其他因素进行限定时，他们发现一种显著（尽 
赀很微小）的差异。 ㉔ 黑人法官与这样一种判决相关联••在 0—93 的严 m 性 M 
表中， m 人法官的判决要低 1.22 个单位。当所研究的样本限于黑人被告时， 
这一影响尤其明显。与白人法官相比，黑人法官对黑人被告的判决，其严重性 
正好低两个单位——但是，尚有更多可继续讨论的地方。 ® 

Probit 分析和 Logit 分析 

威尔奇和她的同事还注意到，判决严重性并不是法 官歌刑 栽决的唯一方 
面，甚至不是 M 为关键的方面。在对 M 刑严重性做出判决之前，法官必须决定 
被告是否将被监禁。一些人受到缓期执行的宽大处理，而且，尽管被判犯有重 
罪，他们仍未被要求人狱服刑。 

当我们以这些方式设想因变最时就无法应用回归分析。相关和回归分析 
假定，因变 M 是在区间或顺序层次上得到测量的。然而，判决监禁是这样被编 
码的 = 监禁 ,0 =不监禁。倘若情况就是这样，那么，我们就无法讨论自变最 
一个单位的变化如何引起因变 tt 若干单位数虽的变化。 

为了处理这些二分的（两类）因变量，另外一种类似于多重回归的分析形 


@ Beta = -0.01, 6= -0. 48；不显著。 
㉔ Beta = -0.03,6 = - 1. 22 0 
㉕ Beta = -0. 05 ,6 = -2.00。 
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式已被设计出来。 ® 社会科学研究者通常所处理的因变 董就是 一些简单的名 
目分类，比如，“是或否”这样的问题 调査； 再比如，各种不同的因素如何影响 
政府决定采纳一项公共政策或加人战争。为了解决这些问题， Probit 分析和 
lx > git 分析日渐频繁地得到运用。 

Probit 并不产生回归系数或贝塔系数，相反，它所产生的系数其自身并不 
容易得到解释 3 借助数学公式（简单起见，在此省略），我们可以运用这些系 
数来评估的变化如何影响 F 将呈现一个值或其他值的槪率。这个统计赓 
有助亍回答这个问题， E 卩，法官种族的差异是否影响重刑犯将在监狱服刑的 
概率 。㉗ 

威尔奇等人利用 Probit 分析来检验 自变贵 和做出监禁判决之间的关系。@ 

他们发现，相比白人法官而言，黑人法官更有可能做出将被告监禁起来的判 

决。但是，当这项研究的发起者限定其他变麽时，这一效应的显著性就会 
消失。 

Probit 分析还表明，呰被限定的因索一旦被引人分析中，那么，在对白人 
被 ft ■做出监禁判决方面就存在显著的种族差异。当白人被告由白人法官判决 
时，他们更不可能被送进 监狱； 换言之，当罪行严敢性和其他因素被考虑进来 
时，黑人法官更有可能判处白人被告人狱。 

在对所有这些测》进行评估之后，威尔奇和她的同車得岀结 论：黑 人法官 
的确对刑亊法制度造成影响。以多 ffi 回归的结果以及关于这种特殊样本的 
Probit 分析为基础，黑人法官比白人法官似乎稍微吏有可能 ：（ 丨） 判处白人被 
告 人狱； （2) 对黑人被告进行稍微不怎么严重的判罚。但是，“在关于监禁的 
判决方面，黑人法官似乎是公平的 （对黑 人被告和白人被告都 一样） ，但是，相 
比黑人被告而言，白人法官更不可能将白人被告送迸监狱”。 ㉙ 请注意，这项 
研究的发起者对他们的结果进行了限定，并尽力解释多种 因素这 些因素可能 
解释为什么黑人和白人在行为上有所不同。 


㉖ 这种程序指的就是 probit 分析和 logit 分析，或某些情况下所说的“逻辑斯蒂回归•，就 
因变 ft 的深层分布而言， pmbit 和 logit 的假定略有不同。参见 J . Aldrich & F . Nelson , Linear 
ProbabilUy , LogU and Probu ModeU , Sage University Paper Series on Quantitative Applications in the 
Social Science , no . 45 ( Beverly Hills , Calif . : Sage Publications , 1984 ) 0 


㉗ 当相关和回归被用来测定某种关系时，这个 统计量 可检验一条直线或斜率如何很好地 
代表数据。当我们运用 probit 分析时，这个统计屋检验 的是: A ： 和 F 之间的关系如何由一条 S 形 

曲线很好体现出来。寻求判决监禁 （ F ) 和罪行严重性 U ) 之间线性关联 （相 关和 回归） 的统计 
置，可能会遗漏这种关系，并且导致许多预测 误差。 

㉘ 引自 Welch ei al . , '* Do Black Judges Make a Difference ?” 表 1 ， pn)b it 系数指的是 MLEs 

(极大似麵 i +)。 Weleh 等人认 舱个隸 ftS 賴，娜 它至少 賊雛误差大小麵倍的 
话 （ MLE / SE >2.0)。 


® Welch el al . f p . 134. 
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表 5.9 变置间关系的测量 

相关 

两个区间层次或比例层次的变量之间的关联度或共变度。关系的方向由 
+或-来表示。 

双变量回归 

区间层次或比例层次的因变量与单一自变量一个单位的变化相关联的变 
化量。 

多重回归 

由若干变量所解释的一个区间层次或比例层次的因变量的变化贵。针对 
每一个自变 a 的独特影响进行测试。多重回归结合# 一起使用，后者表 
明由自变贵的共同作用所解释的因变 t 的变化比例 a 

Probit 分析和 

一种多 重回归形式，在其中，因变 t 是二分的（例如，是/ 否； 赞成/反 对〉。 

Logit 分析 

它考察一个自变》—个单位的变化导致因变量采取一个值或另一个值的 
槪率变化。 


我们归纳了到目前为止所提出的有关变摄间关系的测 M , 请参阅表 5. 9。 

回归的主要问题与下面这一点 相关： 厘淸若干自变 M 对一个因变故的相 
互关联的影响或统计上的交叉影响。这个问题通过以下方式得以解决 （ 尽管 
很少得到圆满解决） ：精确 的操作、关于相似自变战协变异的分析，以及利用 
像 Probit 分析这样的技术。 

在任何一种多 歌回归 模型或 Probit 分析中，大班的技术细节、预防措施以 
及限制性假定在结果被愤重处理以前必须被考虑进来。但是，我们在此所寻 
求的就是分析的逻辑。若干变 St 会影响法院裁决。研究者的逻辑表明，其中 
一些变》：需加以解释或在统计上加以限定，以便他们可以就他们尤其感兴趣 
的一个变撖（种族）提出结论。在这个例子中，悄况似乎是这样 的：存 在一些 
显著的种族效应，即使我们已经对其他因素（比如，罪行严 重性） 进行了限定。 

尽管统计学使得回归和 Probit 分析似乎技术性很强，但与一般而言的科 
学一样，它们都始于创造性和想象力。最初一部分的回归分析所涉及的问题， 
就是弄清楚哪些变®是需要测试的——而这一点又始于对理论的某种意识， 
以及对所研究的主题的敏锐感受。回归分析的效用就在于，它为我们更为精 
确地测 M 假说中的变最间关系指出了可能性。 


计算机和统计学 

计算机统计软件的发展使研究者得以迅速而又有效地处理数据。—些数 
学及概念上的背景过去一直是统计学计算的先决条件。现如今，计算机可以 
进行数学演算。在某些情况下，这也就意味着，我们以与测量层次不相称的方 
式来操纵数据。 
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尽管将数学演算留给计算机是可能的，但是，如果不能充分意识到数学处 
理的概念基础，那么运用统计技术就是很危险的。原因恰恰就在 于：虽 然一个 
软件包可以产生出两个变量的相关统计量，但这并不意味着相关所必需的测 
馈标准已经得到满足。我们情不自禁地釆用软件所产生的统计量，这些统计 
M 似乎提供了极高的精确性，但是，没有任何东西可替代下面这 一点： 根据本 
章（见图 5. 1 ) 所提出的指导原则，对数据的属性和特征进行慎重的评估。 

统计学不创造 数据； 它们只描述数据。通过指出某一抽象事物的颜色或 
其他物理厲性的方式来描述这一事物，这样做是毫无意 义的； 同样，声称各种 
统计关系中没有一种可被计算，也是有误导性的。 

我们所讨论的精细改进，其本身只是进一步工作（为了精心制定并且改 
进研究策略，我们能够做些什么）的开始。我们只是想设法拟定理解和技术 
的发展方向。通常说来，研究技巧的深人发展，与其说来自贯穿方法论文本的 
被迫进展，不如说来自一项令人关注的计划所激发的动力。随着这项计划的 
进展，方法论的重要性就会变得更加显著，并且也更值得学习。 

但是，在谋求方法论的理解时，要谨防一种简单的“食谱式”的研究方法。 
在列举具体的方法之前，一定要弄淸楚你想做什么，借助这些具体的方法，你 
的想法得以实现。这至少是本书的倾向性意见，且也是本书作者的经验。如 
果能够明了计算背后相对简单的观念，那么，在专门的方法论文献中所发现的 
众多细节，就会变得更加容易理解。观念提供了技术机制的构架。 

引入的概念 


测量 （ measurement) 

变董的属性 （properties of variables ) 
名目 （ nominal) 

顺序 （ ordinal) 

区间 （ interval) 

真实零点 （true zero) 

比例 （ ratio) 

任意零点 （arbitrary zero) 

概率 （ probability) 

显著性水平 （level of significance) 

概率样本 （probability sample) 
分层化 （ stratification) 

抽样偏差 （sampling bias) 


描述性统计 （descriptive statistics) 
相关 （correlation ) 

关联方向 （direction of association ) 
相关董表 （scale of correction ) 
列联系数 （contingency coefficient) 
皮尔逊相关系数 （ pearson ’ s r) 
回归分析 （regression analysis) 
斜率 （ slope) 

多重回归 （multiple regression ) 
标准偏差 （standard deviation) 
贝塔系数 （Beta coefficient) 

隨机抽样 （random sampling) 

关联 （association ) 
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1. 回想下面这一 点：样 本被用来推测一个更大母体的某些特征。思考这个问 
题，被用来搜集佩罗数据的抽样技术和方法如何导致结果发生偏差？ 

2. •仔细查看表 5. 1( 摘自氮罗调查）的问題。在对回答者的态度进行测量时, 
问题的措辞如何引起误差？ 

3. 我们能够设想一种用于佩罗调查问题的更为中性的措辞吗？中性措辞怎样 
并且为什么会造就这样一种测量值，它能更准确地推断出母体的测量值？ 

4. 一支棒球队的最终分区排名（在分赛区中的位置）是有效阐明球队成绩这 
个概念的一个区间变董吗？关于球队成绩的更好的区间层次的测董可能是什么？ 

5•参阅布罗金顿等人的文章（附录 B ) 中的图1，如果回归系数（或斜率）仅为 
0.25, 那么，代表少数族群人口和少数族群席位份额之间关系的那条线会是什么样 
子？如果回归系数为1.5,又会是什么样子？较大或较小斜率的实质意义是什么？ 
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“与权力结合的知识体现的恰恰就是生命自身的历史……’， 

J . P . 狄更斯 （John Patrick Diggins ) 

我们的简要研究始于这样一种求知基 础：语 言概念从基本的人类经验中 
的突现。通过对科学操作层面的考察，我们获得一些洞见，借助这些洞见，我 
们现在可以以一种更为老道的方式来处理建立在 这—基 础之上的方法结构。 
是时候该把科学本身 W •于一种更为宽泛的理解视域之中了。我们有必要对下 
列问题多一 些丫解：科学 如何与一种吏为宽泛的关于知识的观点相 契合； 科学 
家如何与科学 相关； 说后，我们每个人如何能够将科学作为提高我们能力的一 
种手段来运用，即如何通过科学提高我们对付我们自身环境的能力。 

事实性、现实和真实性 

科学方法在初出现时，通常是作为一种狭隘而有限的获得理解的方式。 

对梢确性的严格要求，令人生畏的统计学，经常使得结果难以理解。同时，狂 

热的科学捍卫者有时很轻率地对科学提出更多 要求其 要求已超出科学作为 

—种 知识策略所能承受的范围。他们捏造出一种虚构的客观性，而混淆了如 

下两个方面 ：其一 就是检验假说的科学 程序； 其二就是要求个人与专业上能够 
免除偏差与偏见。 

在试图获得关于科学的深刻理解时，我们可以从 20 世纪一个研究人类状 
况的伟大理论家身上学到一些东西，这个人就是埃 里克. 埃里克森（£以 
Erikson )。 在其作为一个心理分析学家的经历中，埃里克森研究了各种亚文 
化群，并且广泛地研究了历史上的一些至关重要的人格特征，这使得他最终认 
为，理 解具有 多重维度的特征。在我们同我们周围世界的关系中，埃里克森区 
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分出三种 维度： 事实性、现实和真实性。 ® 我们将看到，科学同每一个维度都 
息息相关。 

三者当中，事实性最切近流行的科学方法论观点。 事实性就是“事实、数 
据和技术的总体，这些事实、数据和技术可用观察方法和时代的有效技术加以 
证实” 。② 

我们在此一直在进行的大部分的思索都涉及努力确定那个难以捉摸的研 
究项——事实。对于事实这个词，我们早先隐约流露出一种个人不满情绪。 
但是截至目前，我们已经谈论得足够多，目的就是为了澄清这一 点：勿 将事实 
与真理混同。某一事实，实际上仅相当于用以确立这一事实的证实方法，也相 
当于这一事实从中获得意义的参 照系。 大 M 的科学都包括，运用方法论的进 
展来修正、调整甚或证伪那些由较为粗糙或较为偃化的技术业已“证实”的 
“事实”和理论。我们力图系统地证实观察，通过这种方式，我们强化了我们 
对世界的感知和外在于我们自身的现象之间的连接。 

对深思熟虑的变域说明、梢确的测橄，以及关于结果的滿慎解释的全部关 
注，都与发展出那些有资格被称为事实性的数据相关，并且与理解这些数据的 
局限性相关。尽管事实性世界观似乎很少具有 （ 比如说）理想化观点的魅力 
和梢妙之处，但我们一直试图证明，它有其自身的力 a 和社会效用。尽管在创 
造事实性信息上存在的限制，和我们从事该任务卷人的人类特性，都滞要一种 
更为广泛的知识视角，但事实性仍旧是世界观的必要组成部分。 

理解的第二个维度或方面是现实，它看似不那么具体，但或许直观上很简 
单。我们对什么构成现实的感觉，并不仅仅是事实性的赍加。 相反，就现实而 
言，我们所知道的是一种关于事实性的观点，这种事实性由我们藉以理解这些 
现实事物的感官所整合。 只要搜集亊实的技术局限性、时间的压力，以及我们 
理解背软中的无意识因素已固定，那么，我们必须意识到，无论我们多么努力， 
我们的理解都决不可能是亊实性的。而且也无需如此。科学是一门发现并组 
织证据的学科，这些证据与我们感兴趣的东西相关。然后，我们试图运用那些 
证据来塑造我们的现实观。因此，我们可以正当地要求，那些致力于科学的人 
士传达给我们的并不只是“事实”，而是他们根据其数据反思得来的关于现实 
的某种认识。 

—门科学要成为社会科学，必须要在科学准则（即，其陈述必须被证实） 


① 参见 Erik Erikson, Gandhi' s Truth( New York ： Norton, 1969 ) p. 396;Dimensions of a New 
Identity (New ^ ork : Narton, 1974) ， pp. 33-34 ； 另见 History and the Historical Moment ( New 
York: Norton, 1975)， PP . 103-104 。 埃里克森对这些槪念的阐释稍微有些差异，我们对其做了 

修改，以便配合此处说明的需要 a 埃里克森如何阐发他的分析，关于这一点的一种有趣的说明， 
可参见 Lewrence Friedman, Erik Erikson： Identity' s Architect ( New York ： Scribner’s ， 1999) 0 

② Erikson, Dimensions of a New Identity, p. 33. 
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和社会亟需 （ EU , 它必须对文明危机有所作为）之间进行一种平衡活动。社会 
理论的证实通常滞后于社会政策的迫切需要。把被证实的东西与经由一种富 
有洞见的现实感所获得的思辨结果融合起来，我们就提高了充分理解这个世 
界的可能性，并且也提高了我们改变世界的可能性。详述这种研究实在的途 
径绝非易事，而且我们也无法确切说明它如何实现——只能说，个人承诺、经 
验、将成见搁置起来的意愿，以及良好的科学程序，都会产生某种影响。 

然而，事实性（数据和观察的世界）和某种现实感（我们藉以理解证据的 
观点）尚未构成知识界。埃里克森指出，就我们的目的而言，存在的第三个维 
度—— 真实性 ——意指我们在 行动中和通过行动所获得的知识。 

科学是反思性研究的生动 写照： 研究者观察现象以搜集信息，然后归隐在 
一个安静的地方，汇总、融会并概括所能知晓的东西。然而，这样一种“超然 
世外”式的理解模式并非我们大多数人的典型模式。人类似乎更趋向行动而 
不是反思。真实性与我们如何在我们的求知模式以及行为契机影响（或两者 
之间交互影响）下行动有一定的关联。 

通过对他自身作为一个心理分析学家的经验的讨论，埃里克森具体说明 
了他关于苽实性的概念。心理分析主要是一种创造性的行为研究类型。埃里 
克森认为，治疗从未真正成为这样一个 过程： 经由这个过程，医生为病人规定 
某种行动 步骤； 相反，它是一个相互探索的 过程： 心理分析学家为探索提供训 
练和经验，病人则提供他们的个人史、深层情感，以及洞察和行动的能力。心 
理分析的“交心”治疗与医生和病人之间的潜能相契合。 

同样的道理也适用于社会科学研究。我们所研究的行为，并不是被放在 
载玻片上的，或者只是试管中的泡沫，其形成出于同样的动力法则，这些法则 
促使研究者作为一个人来进行活动。 M 好的社会科学家能够献身于他们所研 
究的行为。他们运用严格的分析，但同时又深人到行动当中，这种行动本身就 
是一种理解之源。 

社会科学家对自身涉人他们所研究的行为这个问题很慎重。显而易见的 
原因就是，如果不介人由投人所激发的情感，那么有条不紊的思考就相当难以 
实现。然而，所有社会研究都包括自我与外在于我们自身的某种东西之间的 
交互作用。作为一种个人立场，“超然世外”与个人涉入一样，有其自身的缺 
点。无论采用哪种策略，好的研究的确都要求一种相当高的意识水平。 科学 
方法使研究者意识到，他们在处理观察的证实时的（自身产生的）部分交互作 
用 ，并且 阐明这种交互作用。 同样 ，一 个人必须高度意识到，其自身的经验和 
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个性如何卷入到理解工作当中。③ 

除了迫使我们认清研究中的个人因素之外，埃里克森还指出，实验涉人开 
后了产生洞见的潜力。行为是反思 性的； 它通过与环境的交互作用而出现。 
在某种环境中理解所经验的交互作用需要一种关于何谓人类行为的“感觉”。 
这种理解需要一种关于事实性的正确评价，以及一种关于现实的观点，而且还 
需要一种关于行动及行动所能揭示的东西的感觉。 

最近，研究者对目前所谓的观察研究的兴趣日渐浓厚。这些研究试图更 
大限度地掌握尚在研究中的现实。开放式面谈、对环境的引导式描述、个人经 
验的直接报告，均是这种研究方法的特征。观察研究具有明显的像故事一样 
的性质，在这种性质背后，通常是一种深思熟虑的努力，以便检验某些理论，并 
且为假说提供证据。科学与其说是在进行变最说明和关系测最，倒不如说是 
在搜寻至关重要的观察，并推出它们的理论蕴涵。④ 

每个学生都经历过这种过 程：理 智地学习某种知识，随后又在经验中重新 
学习。科学被推崇为一种求知模式，这种模式将最大限度地促进一个人能力 
的提升，使其能够确定事实、理解事实周围的现实，并且灵活地研究真实性。 

科学主要是一•种态度和一套普遍方针，而非一种具体 策略。 有许多可能 
的研究策略，可在不同层次的事实性、现实和真实性上获得。策略选择是挑战 
的一部分。⑤ 

女性主义学者已提出新的关于社会科学方法论的观点，这些观点使我们 


③ 若干社会科学的经典名著的特殊价值应归功于作者个人涉人他们的研究主题。例如 
Floyd Hunter, Community Power Structure (New York ： Doubleday, 1963) ； Robert Lane, Political 
Ideology : Why the American Common Man Believes What He Does ( New York ： Free Press, 1962) ; C. 
Wright Mills, The Power Elite ( New York ： Oxford University Press, 1959) ； William Whyle, Street 
Comer Society (Chicago : University of Chicago Press, I943) 0 

④ 这些方法的若干资料 来海, 可参见 Herbert Blumer, ed. f “The Methodological Position of 
Symbolic Interaction , M Symbolic InteractionUm : Perspective and Method ( Englewood Cliffs, N. J. : 
Prentice-Hall, 1969) , pp. 1-60 ； Howard S. Becker, *'Problems of Inference and Proof in Participant 
Observation, M American Sociological Review 2 ?, (1958 )； George McCall, “The Problems of Indicators 
in Participant Observation Research,” Issues in Participam ObsemUion , eds. George McCall & J. L. 
Simmons ( Reading, Mass. : Addison-Wesley, 1969) ， pp. 230-239 ； John Lofland, Analyzing Social 
Settings ( Belmont, Calif. : Wadsworth, 1973 )。 

⑤ 一些资 料来源 将有助于研究 策略间 的选择 问题 ： Moiris Zelditch, Jr. , - Some 
Methodological Problems in Field Studies，” American Journal of Sociology 67 (March 1962) ： 566- 
576; Donald Warwick, ** Survey Research and Participant Observation ： A Benefit-Cost Analysis,” 
Comparative Research Methods % eds. Donald Warwick and Samuel Asherson ( Englewood Cliffs, N. J. : 
Prentice-Hail, 1973) ， pp. 189-203 ； Davydd Greenwood, William Foote Whyle, and Ira Harkevy, 

'• Participatory Action Research in a Process and as a Goal,” Human Relations 46, no. 2 (1993 )： 
175-192 。 ' 
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在思考证据时有更为广泛的策略选择余地。其研究指出，女人和男人在心理 
发展中存在显著差异，利用这些研究，这些研究者提出，对人类社会的关系特 
征的女性主义研究，必须纳人到社会科学的研究机制当中。例如，严格控制数 
据定义的技术，以及确定问卷回答分类的界限的技术，必须辅以长期的访谈， 
以及其他形式的定性证据搜集。根据这种观点，激发对人类关系的相互依赖 
性的研究，无论是通过定性观察还是通过定*观察，都应当成为任何一种社会 
研究的一个重要组成部分。⑥ 

道德与科学局限性 

先前讨论表明，科学并不回答所有问题，而且科学所确实提供的答案必须 
被* i •其他形式的理解观点之中。换言之，科学有其自身的限度。到了该阐 
明这些限度的时候了。 

对于允许人类以一种文明且和睦的方式共存的道德价值的关注，要求我 
们接受对下述两个方面的限制 ：其一 就是我们如何进行社会科学 研究； 其二就 
是我们可以实现何种结果。对审愤和伦理的关注要求我们，考虑到科学知识 
所不能证明的东西而对科学知识的主张进行限制，而且要求我们承认，其他知 
识策略提供更好解答的可能性。以上主题都值得深人研究。 

采取一种科学途径来研究人类行为，涉及两类主要的道德问题。在研究 
计划中对人进行操纵，对于卷人研究的个人而言可能相当危险，而且，科学研 
究的成果可能被用来剥削人类，而非造福人类。 

操纵实验对象所面临的道德困境的一个著名例子，就是研究权威服从的 
米尔格伦实验。⑦这项实验要求自愿者在“科学研究者，，的指引下对“学生，，实 
施电击，以便激发他们学会他们正在学习的材料。这些自愿者被 告知： 这项实 
验与测试一种方法有关，这一方法可以更有效地教导人们学习某些特定种类 
的材料。但这项实验的真正要点，其实是测试人们对权威人物（在这个案例 
中，就是社会科学研究者）的服从。自愿者并不知晓 ：电击 其实是骗人的，而 
自愿者自身的行为才是这个实验的真正对象。这里包含许多诡计。后来，研 


⑥ 参见 Sandra Harding ， Feminism and Methodology ( Bloomington : Indiana University Press, 
1987); Carol Gilligan, In a Different Voice : Psychological Theory and Women' s Development 
(Cambridge, Mass. : Harvard University Press. 1982) ； 研究中运用这些观念的一个有趣例子，可 
参见 Hand Jack and Dana Jack, Moral Vision and Professional Decisions： The Changing Values of 

and Men Lawyers (New York ： Cambridge University Press, 1989 )。 

⑦ Stanley Milgram, The Individual in a Social World ( Reading, Mass. : Addison-Weslev 
1977). 
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究者向这些自愿者解释这项实验，并为一些自愿者提供进一步的咨询服务。 
许多自愿者发现他们出于对专家权威的盲目反应，而一直心甘情愿地向人们 
实施明显危险的电击后都十分沮丧。 

若对过度狂热的科学家加以庇护，便有可能出现真正的灾难。一个相当 
贴切的例子，就是利用未存疑心的人类来实验测定核子辐射和原子弹测试的 
$辑射效应。美国政府目前正努力寻找受害人，并且寻找补救他们的措施。 

社会科学的目的应当是改善人类生活质最。这一崇卨目的并未证明，运 
用下列降低人类生活质撒的手段就是正当 的：无 论是通过欺骗使人们做出在 
正常情况下将感到极其后悔的事情，还是通过揭露他们的内在动机而对带给 
个人的后果不负责任的方式。社会科学家必须信任实验对象，并且争得他们 
明确的同意，这是参与的一个前提。 

尽管处理实验对象的伦理问题在研究者的控制之下，而且 诚于研 究者的 
责任，但是，当我们思考社会科学研究的可开发的潜能时，一个更为棘手的道 
德问题还是会出现。有关社会科学运用的争论因一项涉及那些在20世纪40 
年代对原子武器进行独创研究的科学家而发生。他们论证说，他们正贯彻科 
学的路线——科学的运用是其他领域的事悄。尽管社会科学家没有原子弹可 
供炫耀他们的努力，但社会科学已经幵始研制的社会控制技术，亦可能被证明 
具有巨大的影响，这些影响理应受到同样的道德关注。 

我们无法在此平息这些道德论争，只是想表明，推动科学进步的原因并不 
具有特殊的伦理地位。打肴科学的幌子做某种事情，不能成为任何人逃避道 
德考虑的借口，这些道德考虑使人道生活成为可能。 

这里所讨论的道德考虑，的确限制着凭借道德良知所进行的研究种类。 
另外一种限制，并非来自应用于科学的伦理考虑，而是来自科学本身的真正本 
质。记住，科学幵始于（也终结于）不确定性。⑧科学的任务就是减少不确定 
性，但最终仍无法消除它。倘若能消除，那科学家便会成为神而不是人。 

人们对是否存在神存在分歧，科学无法解决这个 问题。 科学方法只是一 
种工具，人类可以运用这种工具，试图减少我们都要遭遇到的不可避免的不确 
定性。人类本身是能力有限的观察者，而科学所运用的技术和工具亦不完美。 
这也正是强调外在公开证据和结果可重复性的原因所在。 

重点在于，真正的科学家根据现存证据进行槪括，但他们不会在证据允许 
的范围之外做出断言。他们的确不否认，其他类型的知识 （ 比如，信仰、直觉 
或习俗）也有可能体现智慧，这种智慧超出科学家所理解的证据所及的范围。 
科学家能够而且应当运用证据技术针对这些其他类型的知识所做的断言进行 


⑧这一论点可能扯得太远了。其中一位作者的一位朋友在听到物理学家如何认清宇宙的 
本质最终是不确定的陈述之后，评论 道：“ 当这些家伙打算炸毁某物时，他们倒似乎非常确切地 
知道如何做!” 
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检验。有许多良好的结果可证实这种作为，例如，任何医学史的调査都将证明 
这一点，然而，科学目前仍无法解释某些医学结果。这些结果可能归因于人类 
理解范围之外的力量，所有人都可以怀疑这一点，但不能打着科学的幌子否认 
这一点。以信仰为基础的主张，也不应该被用来为科学必然带来的不宽容进 
行辩护。 

为了使这一论点更接近社会科学，我们来思考心理分析科学的运用和局 
限。我们知道，成年人的某些伤害行为模式，可追溯至早年遭受的创伤，但这 
并不意味着，所有行为都发端于孩童时期的经验。显然尚有其他力量在起作 
用。现代心理分析的创始人，西格 蒙德. 弗洛伊德 （Sigrmind Freud ) 曾注意 
到，其病人约有三分之一有所好转，三分之一保持原状，还有三分之一病情恶 
化。并非所有病人的病情都恶化，因为他可能已经提髙了三分之一病人好转 
的可能性，但无论如何这与以完全理解为基础的治疗所能产生的那种结果还 
是相去甚远。 

因此，在解决某些人的问题时，心理分析可能对他们有效，但不能把它作 
为一个借口，否认其他备选行为解释存在的可能性——至少在证据更为梢确 
之前不能否认。即使到了大部分人类都运用科学的时候，我们身为观察者的 
局限也不能导致心理分析（或任何其他的科学）做出确定性的主张。更何况， 
自然科学本来就是在无从测世的无限宇宙中起作用。 

此处所提供的信息就在于，对人性价值的道德关注：要对科学的傲慢及 
对信仰、直觉和习俗的主张进行限制。如果我们打算有效地处理不确定性，那 
么，对备选理解形式的一定限度的宽容就是必不可少的。若缺少一定限度的 
宽容，我们便有可能越出我们的人类本性所设定的界限。后果可能相当危险， 
比如，任何宗教审判、政治大屠杀，以及“科学上正当的”对人类生命的虐待， 
都可以证明这一点。 

科学不是一种道德体系。它是了解生命和宇宙的一种策略，仅此而已。 
确立信仰、直觉和习俗的界限，超出本书讨论的范围，尽管我们的研究的确建 
议，所有类型的知识都应当尽力为了文明生活的福祉而和平共存。 

我们要 r 解科学止于何处以及信仰始于何处，除此之外，我们还有必要意 
识到，除了科学和宗教，还存在其他的研究知识的途径。科学将其自身限定在 
可观察的事物及我们所称的“现实检验”之中。在这 一方面 ，社会科学家追随 
自然科学家，后者逐步建立起关于可观察证据的概括。然而，人类行为区别于 
植物和岩石的地方就在于，它可能由不可观察的力量和预谋所驱使。 

举个例子，古希腊哲学家柏拉图认为，我们所看到的“现实”只是感觉印 
象—感觉印象处在这一过程之中 ：它靠 近或远离隐藏在意见背后的某种完 
美理念。因此，我们所看到的每张具体的椅子，只不过是椅子理念的不完美实 
现，椅子的理念只存在于人类想象之中。同样，任何一种现存的政府形式，只 
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是接近于一种理想化的政府形式，这种理想形式可以从对人类状况的理解中 
引申出来。这改变了知识的意义。举例而言，根据柏拉图的观点，要“了解” 
芝加哥政府，就是要观察它合乎一种理想政府类型的地方在哪里。通过与这 
种理想类型的比较，芝加哥政府的成败得失便可被界定，而且亦可对其未来的 
表现进行预测。 

再举个例子，卡尔 • 马克思 （Kari Marx ) 表面上为阶级、异化、剥削诸如此 
类的关键概念提供了太多定义，结果把大多数以科学为导向的读者都搞糊涂 
了。但是他的所有定义都合乎一种动态模 型：人 类经由各种形态的历史演变 
为实现其内在本质而斗争。 

人类的内在本质是什么？马克思通过对人与动物的区分来处理这个问 
题。我们有能力选择生产什么，而动物则没有这种能力。例如，动物制造蛘房 
与巢穴，但它们之所以这样做，要么是根据本能，要么是根据偶然的试错法。 
另一方面，人类可以采集一些树枝来建造居所、小船或一些牙签。马克思相 
信，当每个人花鍛少的时间进行必需品的生产，而花最多的时间进行有意识的 
选择性生产活动时，我们人类将成为真正的人。 

这样一来，在马克思看来，剥削可根据不同的方式得以界定，不同阶级的 
人们在不 N 的历史时期利用不同的方式，以保护必需品并实现一定程度的独 
立性。剥削的最终结果是这样一个 社会： 在其中，所有个体都将分担必笳品生 
产的责任，如此一来，所有人都有可能共享有意识地选杼生产活动的自由。它 
将成为这样一个 社会： 在其中，没有阶级、没有异化，也没有统治。 

柏拉图和马克思所提出的知识形式，在某种意义上超出科学的领域，因为 
它们都依赖于无法直接观察到的“本质”与“内在 关系， 在另外一种意义上， 
柏拉 ra 体系所容许的预测或者马克思所认同的历史模式在可观察的 方面可 

以运用科学途径加以检验，这些科学途径可能会阐明它们在解释观察现象时 
的效用。 

我们也有可能进人柏拉图或马克思的方法论世界，并对这些本质和关系 
的根本假定提出挑战—或者，对马克思关于我们的“类本质，，的观点的充分 
性和完善性提出挑战。⑨重点在于，人类有能力超出“是什么 ，，的 范围去思考 
“可能是什么”，甚或“应该是什么”。审慎告诉我们••我们需要的是所有知识 
界中最好的知识，而不仅仅是其中一种完美的知识而已。 


⑨名想深入研究这些观念，可参见 Kenneth Hoover ， Ideology and Political Life , 3 1x1 ed. ( New 
York: Harcourt , 2001 ) , ch. 6. cf. Bertel! Oilman t Alienaiion : Marx ' s Theory of Human Nature % 2 ,M, 

ed - (New York: Cambrid « e Univerei| y Pre ss, 1976)； Paul Thomas, “Marx and Science, w Political 
Studies 24, no. 1 ( 1978 ) : 1-23； Terence Ball and James Farr, eds. , After Marx ( Cambridge, 
England: Cambridge University Press, 1984), pp. 217-260； and James Farr, “ Mane ， s Laws，” 
Political Studies 34, no. 2 (1986) : 202-222 0 ’ 
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科学家、科学和范式 

科学是由人而不是由机器实践的。或者更确切点说，科学是由群体的人 
实践的。社会科学研究的主要领域都由科学家共同体主导。他们通常定居在 
大型的研究机构中，并通过期刊、学术会议，以及相互评价和讨论的程序紧密 
结合在一起。⑩尽管在这些科学共同体内部，时常存在一些实质性分歧，但对 
于原则性问题的界限、解决这些问题的标准，以及这些标准的价值（即必须为 
科学家解决这些问题提供行为规范），科学家通常会达成大致的共识。例如， 
在美国社会科学共同体中，没有人会撰写独裁政府值得向往的文章。 

有一些共同体已涉足社会科学的事业，在评价社会科学研究时，这一事实 
会带来大《有待考虑的因索。首先，我们很少有人真正愿意独树一帜或与众 
不同。人们尤其不喜欢必须面对大世的问题，这些问题完全是因他们自己的 
观点而起。我们的意思是说，在所有人类行为中都存在一种趋于顺从的自然 
的心理压力，科学研究中同样如此。 

若 F 因家强化了这种趋于顺从的倾向。其中一种因素就是学科的职业建 
制。尽管多数学生无法察觉，但学术机构中的职位一般都与一种师传相承体 
制挂钩。师从名师的人，可以 i 某得般好的职位，也最容易获得一些途径来交流 
他们的观点。谁能接近老师，以及他碟她如何得以将自己的职位发展成为有 
声望的学术事业，能力当然有很大的关系。但是这套体制的真正影响在于，它 
极大地强化了固有观点的永恒性，因为徒弟通常会认同师傅的立场。 

对于这种顺从的压力，另外一种因素也搀和进 来：社 会科学研究的政治意 
义。例如，探査经济系统或社会福利机构中的腐败因索的研究者，不大可能得 
到他们的目标对象的支持。即便是针对社会经济权力的调査，一旦它成为社 
区决策的一部分，也会立即引发争论。由于学校和机构通常由代表主导性利 
益集 W 1 的理事会负责运作，所以某些类型的研究计划有可能遭致职业风险。 

另外一种影响顺从于较安全的社会解释形式的因素就在于，研究需要经 
费。优秀的社会科学依赖于调査研究，而这需耗费大量金钱，而且往往需要来 
自政府机构、企业或基金会的财政支持。能吸引这些资助的专家，不大可能与 
盛行的社会和政治观念隔阂太远。 

基于上述原因，科学研究的特征通常由思想流派或范式体现出来，这些思 


⑩关于科学史的一种引人人胜的探讨，详细说明了科学共同体在构造理解时的角色，这一 
探讨就是 Thomas Kuhn, The Structure of Scientific Revolutions, 2 nd ed. ( Chicago ： University of 
Chicago Press ， 1970), 此处所讨论的一些主题以这本书为基础。 
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想流派或范式构成问题界定及解决的方式。然而在面临所有这些压力时，科 
学方法的最终优点（与其他类型的研究相比）就在于，积累知识的步骤是公开 
的，且乐意接受质疑与挑战。我们详述这些有损于研究的因素，重点不是要怀 
疑科学，因为大部分的因素同样会在其他类型的研究中起作用，而是要强调另 
有原因促使我们对已接受的知识保持批判态度，而对自己的评价标准要保持 
科学的态度。当我们阅读任何一本书籍 、学习 任何一门课程，或选择任何一种 
研究领域时，首先要问的一个问题就 是：这 种研究类型的背后，主导的范式是 
什么？ 一旦理解了范式，你就有权对证据做出谨慎的评价。 

使社会科学满足人类需求 

正如我们所看到的，就其作为一种研究工具的全部效用而言，社会科学在 
其方法论中也带有支配和操纵的可能性。通常说来，研究者运用与人类行为 
相关的数据，回答的是研究者的问题，而非实验对象本该回答的问题。研究的 
设计或许将主体转变为被动反应者，其行为以超出主体控制范围的方式得到 
解释或重新界定。 M 终，运用研究的目的，可能依赖于有权控制他人的那部分 
人的优先权，不管该权力是否用于满足人类®求的合法目的。 

对于这些问题，以及对于我们在此已描述过的社会科学方法论的若干限 
制，有一种有趣的研究途径，它已由怀特 （William Foote Whyte )、 柯林伍德 
(Davydd Greenwood ) 、赖兹 （Peter Lazes ) 以及他们在康奈尔大学的同事们提 
出。⑪它被命名为参与行为研究，这一技术保留了社会科学研究的梢神，同时 
也以如下方式敞开研究 进程： 将其效用推广至民众，并提出寓有创见的解决问 
题的途径。以下两个例子可说明如何运用这种技术。 

现代发印机的创始者施乐公司，呰因为日本的竞争，一度受到市场占有率 
急剧下降的威胁。公司的最初反应是考虑将生产作业转移到没有工会的地 
区，以此降低劳动成本。他们的分析重点是将劳动成本作为关键变撤，解决办 
法很简单 ：裁员 并削减工资。受邀前来协助解决这个问题的一个研究者提出， 
更主要的问题出在总生产成本上，而不仅仅是占生产成本不及20%的直接劳 
动成本，而且，对于如何解决这个问题，工人自己或许有一些想法。研究人员、 
工会会员和管理方共同参与而组成一个“成本研究团队”，这使得公司有了广 
阔的选择余地。其中一个颇富戏剧性的方法是调整间接（非生产）员工相对 
于直接生产工人的比例，由1979年的 2. 丨 •• 1改变为1985年的 0.4 : 1，同时却 


⑪报告见 William Foote Whyte , Davydd J . Greenwood , and Peter Lazes , “Participatory Action 
Research : Through Practice to Science in Social Research ，” American Behavioral Scientists 32, no . 5 
(1989)： 513-551 0 
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又使总产 M 翻倍。这主要是通过如下方式实现的 ：将监 督和控制职能转交给 
工人本人，同时改变工会章程，以保障不同专业领域中更大程度的就业连 
续性， 

从方法论的观点看，有趣之处就 在于： 研究“主体”的涉入改变了关键变 
最的定义，并且改变了所考虑的自变量的范围。成本研究团队并未将注意力 
仅集中于付给生产工人的工资率，而是着眼于培训、劳动力的连续性，以及间 
接员工的角色。结果 就是： 既实现了必要的节约，又恢复了具有竞争力的 
定价。 

第二个例子为讨论增加了新的维度。怀特夫妇对一个超过一百家产业合 
作社的网络产生了兴趣，它们集中于西班牙北部的蒙德雷格镇，这些合作 
社包括西班牙 M 大的一家设备生产商，还包括电子元件制造商以及各式各样 
的在国际上有竞争力的产品。蒙德雷格的制造商合作社网络，已经建立了自 
己的银行体制、研究机构，以及医疗和教育体系。紫德雷格的合作社，作为工 
人所有制，以及在商度精密的生产水平上进行控制的一种模式，已具有国际 
意义。 

合作社面临的一个典型问题就在于，将生产效率与工人/所有者参与的显 
荞性水平协凋起来。关键在于如何分析这个问题，以便使蒙德雷格既能够成 
功，又能允许这种学习得以转移到其他的合作方案中。测撤参与的一个常规 
的社会科学途径，可能涉及对参与意见的调査，另外还牵涉到共同决策的案例 
分析。以这些观察为基础，就可以发展出与成功的参与形式相关的一般模式。 

怀特夫妇及其同亊也是运用了这种研究，但他们将之与协商及讨论的过 
程结合起来，这一过程包括来自不同组织阶层的合作社工人/所有者的 W 1 桌会 
议。由于圆桌会议不仅要求对参与提出报告，而且还要提出改善参与的建议， 
所以，先前未料到的参与维度均被揭示出来，并且新的变 微可加 以概念化和测 
M 。 研究的“主体”变成研究设计中的参与者。 

上述研究使这些研究者愈加强烈地认识 到：“ ……测贵受定义左右。糟 
糕的定义导•致误导性的测二者结合在一起，又产生误导性的结论”。⑭这 
些研究者通过扩大定义的来源及目的，在工人参与以及集体管理这两个案例 
中获得了新的洞见。以施乐公司为例，他们最终认识到，有争议的问题远不止 
工人的生 产率； 问题在于复杂国际环境下的组织业绩。以就业连续性为导向 


⑫ Whyte et al. f “Participatory Action Research/ 9 pp. 524-525. 

⑫参见 Making Mondragon ： The Growth and Dynamics of the Worker Cooperative Complex ， 2 nd 
e d- (Ithaca, N. Y. : Cornell University 1LR Press, 1991 ). 另见 Kenneth Hoover, review of Making 
Mondragon in American Political Science Review 84, no. 1 ( 1990) ： 351-352 ； and “ Mondragon ， s 
Answers to Utopia’s Problems，” Utopian Studies. 3 ， no. 2 (1992) : l-20 o 
⑭ Whyte et al. , 44 Participatory Action Research," p. 548. 
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开展工作并提高工人的决策参与度，通过这种方式，施乐公司作为一个竞争者 
的总业绩得到改善。 

请注意，重点集中于以行动为导向的分析，而不只是抽象的理解。这种类 
型的研究通常被称为应用研究，它被认为是纯研究（意指只专注于理智问题 
的研究）的较为拙劣的同类物 o 此处的要点在于，在上述案例中应用于行动 
的研究所产生的概念化和结果，是一个“纯粹”研究者永远无法获得的。这项 
研究的发起人 指出： 

重新思考过往实践，导致理论的再形成，这相应地又导致实践的改 
善。重新思考理论和实践的过程，因而同时强化了理论和实践。⑮ 


参与行为研究具有这样的 效应： 使本章前面所讨论的三重分析层次（事 
实性、现实和真实性）全部起作用。上述两个例子的结果就是，这种形式的研 
究目前已经与一些组织融合，这些组织本身就是适应环境变换的一种方式。 

也许过一段时间，你就会受施乐公司之邀来重新组织这个公司，或受邀到 
西班牙去研究合 作社； 但是，无论你是在研究学生选举中的参与行为、人们对 
政治广告的反应，还是在研究人们在工作场所容忍的阶级与地位观念，这种类 
型的研究都具有应用价值。 


科学的激进主义 

在讨论完科学机构中的顺从倾向之后，我们 圾后还 要以简单篇幅反向思 
考，虽然现在便幵始讨论科学激进主义似乎有悖常理。确实如此，但我们就这 
个话题还是有话可说。科学在社会意义上可以是激进的，在个人意义上亦然。 

科学研究始于对教条的反抗，这些教条由占统治地位的政治及社会机构 
所确立和控制。科学史中包含许多关于无畏分析家的重要案例，这些无畏的 
分析家带着他们的发现走出实验室，其发现威胁到人类研究的各个领域中的 
主流理解。一些科学家甚至为他们所谓的“异端邪说”付出生命。毕竟，信息 
控制是政治权力的根基。科学家坚持认为，信息搜集与结论形成程序应当是 
公开而又可解释的，这样一来，他们便削弱了这样一些人的权力，这些人只会排 
斥科学研究，而一味地支持“华而不实”的理论，以及自利性的意识形态和学说。 

与曰常生活更为相关的是一些方法，根据这些方法，科学的思维习惯可以 
促进你自身能力的提升，使你得以抵制外界条件的作用，并以智慧的方式对付 
环境。以他人的是非观念为基础、要求我们做这做那的各种理由铺天盖地向 
我们每个人袭来。多数时候，对大多数人而言，对资源可靠性的评估，足以将 


⑮ Whyte et al. t “Participatory Action Research/'p. 540. 
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聪明的建议与无稽之谈区分开。但是，这种区分并不妨碍我们拥有一种独立 
评价的方式。 

长期以来，西方文化一直都将社会问题视为一个关乎人性弱点的问题。 
这种研究路径，激发了对个人意图、动机和倾向的反思研究。总的来说，社会 
科学提倡一种不同的途径 ：事先 对你进行全面考察。在决定一个人能否对其 
行为负全责之前，要考虑环境因素、权力结构、外界的影响、人们在社会环境中 
所面临的真实的选择维度，以及人们在解决自身问题时实际拥有的物质可行 
性。与遗传而来的内在倾向，以及有意识与无意识的个体发展史相比，上述那 
些情况有时更易改变。 

科学作为一种方法而进入个人行动之中，这种方法可使我们理解经验的 
过程有条不紊地进行。科学方法保护措施的存在，主要是为了控制这样一种 
自然倾向 ：将我 们出于私人目的而希望的世界面貌投射到观察对象之上。尽 
管科学方法是一种戒律，但在实践中却变成个体解放的一种方法，它使我们从 
自身观点的狭隘性、自身观察力的局限性、自身偏见的压力中解放出来。在一 
个亟待改变的世界中，科学（所有人皆可能发展出的一种 戒律） 可以成为一股 
激进力 M 。 


科学和政治 


改#社会的良苦用心并不缺乏。通常缺少的是一种好的方法。通过国家 
来强行实现乌托邦，或将其实现留给自私自利的个体的自想行为，这两种方法 
都可能带来极大危害。信息充分而又组织得当的理解，可有助于避免两种方 
法走向极端，并且有助于确立个体间达成共识的基础，而不必使用高压政治或 
在自私驱使下主张某人的利益高于另一人的利益。 

一位敏锐的政治观察家提醒 我们： 

如果政治犮展依赖于事实观察，那么虚假的意义就会立即失去它的 
面纱，而依赖于有效意义的某种共识便会出现，至少在见多识广而又受过 
教育的观察者当中如此。上述情况并未发生，即使岁月流逝、物换星移。 
问题、领导者及敌人的一个特征就在于 ：有关 它们意义的争议并未得到平 

息，正是这一特征，使得它们具有政治性 . 没有一门政治学涉及这些事 

务，亦即，呼吁人们就相关事实、它们的意义，以及合理的行动路线达成 
共识。⑯ 


⑯ Murray Edelman ， Constructing the Political Spectacle ( Chicago ： University of Chicago Press . 
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上述这段对政治的批判意味深长，不承认这一点，我们就会曲解这段陈 
述。只要我们能够以可靠信息为基础解决社会问题，那么，我们就更有希望解 
决冲突。方法论的训练是这样一种手段 :将对 信息的歪曲降到最少，同时最大 
限度地扩大相互理解的机会。 

当然，还存在一些本质上具有争议性的问题，这些问题涉及，哪种一致更 
难达成，如果有可能达成一致的话。⑫与大多数科学家不同，公民和政治领导 
人正视行动的必然性。在大多数建设性的政治运用中，人们获得新的洞见并 
发现一些共同利益，这些共同利益产生出有效的共同体行动模式。本书所描 
述的在民主背景下实施的方法，可以有助于上述情况的发生，施乐公司和蒙德 
雷格的例子已表明这一点。政治的领域可以包括，通过社会科学的方法以及 
其他策略来诚恳地追求真理，尽管某些差异最终须靠政治决策过程加以解决。 

政治中还存在另外一种可能。它通过象征性诉求而依赖于意义共鸣，并 
且依赖于巧妙地运用威胁和再保证，以便调动支持力班，平息反对派。⑯这种 
政治的核心是对信息的操纵，并通过信息操纵来操纵民众。另—方面，科学处 
理信息的方式却可以改莕政治。一位德高 望敢的 教师符发现“科学是一种组 
织证据的方法——它渴要一种社会性的决策过程，这一过程使我们免 jffl 少数 
人的统治，同时也使我们免遭无知的 支配” 

科学和政治都与解决不确定性有关，并且二者都牵涉到真•理的证明。毕 
竞，正是甘地借助一种他所坍的典.理力衲的政治手段，才打垮了英国在印度的 
殖民统治。甘地 将声讨 力哦组织起来，这些声讨揭寐了英国殖民统治的剥削 
本质。一旦逍受世界公众舆论的压力，以及被调动起来的民众的新型协同行 
动，英国便被迫 妥协， 美国民权运动的领袖，大都研究甘地的策略，当面临 
美国法定的种族隔离时，他们也采用了相同的策略。 ㉑ 剥削和统治的真相，一 
旦通过分析和证明的方式被揭露出来，就被证明要比操纵、欺骗和高压政治本 
身更具影响。 


⑫关于 “ 本质上具有争议性的槪念 ••（ essentially contestable concepts) 的一种有趣探索，以 
及 t 们对政治的 意乂， 可参见 William Connolly , The Terms of Political Discourse^ 2 nd ed. 
(Princeton, N. J. : Princeton University Press, 1983 )。 

⑬相关例子,可参见 Edelman , Constructing the Political Spectacle ， chs. 3-5 0 
⑬这里提及的这位教师就是克劳森 （Aage Clausen) • 在本书写作过程中，他提出很多价值 
非凡的建议。 

⑳有关真理力量动态学的分析，可参见 Erik Erikson , Gandhi ' s Truth ( New York : Norton, 

1969) 。 本章开头关于事实性、现实和真实性的讨论，来自于埃里克森对甘地策略的研究。具体 
可参阅第 396 页 。另见 Robert Coles , Erik H. Erikson ： The Grou'th of His Work ( New York ： Norton, 

1970) , PP .267-399 。 * ’ 

㉑ Steven Oates 在他的人物传记 如 Trumpet Sound ： The Life of Martin Luther King, Jr. 

(New York： Harper & Row, 1982) 中，回顾了马丁 路德 . 金成为政治领袖的发展历程。 
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最终，真理力量和社会科学方法论，都依赖于一种对诚实与正直价值的道 
德承诺。对抗错误和误解的尝试，毫无疑问，必须以追求真理为基础。没有这 
样一种承诺，政治行动是危险的，科学也将成为一个骗局。 

引入的概念 _ 

事实性 （ factuality) 顺从主义的社会说明 （conformist explanntion) 

现实 （reality ) 职业建制 （career structures ) 

真实性 （ actuality) 参与行为研究 （participatory action research) 

观察研究 （ observational studies) 科学激进主义 （scientific radicalism) 

科学共同体 （scientific communities ) 
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……大约过去一年间，我一直在全力对付一个难解的谜。如果我说的没错，这 
个谜对美国民主的未来而言，具有一定的重要性。它是一个颇费脑力的经典难题, 
有犯罪卒实、布满线索的犯罪现场，以及许多潜在的嫌疑对象„但是，正如在所有 
好的侦探小说中所描述的那样，一些符似可能的歹徒，结果总有无懈可击的辩解， 
而一些重要的暗示猗预兆性发展的线索，在大#开启很久以前就已经发生。而且， 
比如阿加莎 • 克里斯蒂 （Agatha Christie ) 的小说《东方快车谋杀案》，这一罪行或许 
本来就有一个以上的罪犯，所以我们必须分淸主犯和从犯。 M 后，我必须首先声 
明，我也不敢保证我已经解汗这个谜。在这种意义上，解谜工作尚在进行。我准铬 
起诉一个首要的嫌疑对象，但证据尚不足以将其定罪，因此我遨 i # 你来帮助厘淸 
线索。 


社会资本的理论和测量 

几年前，我主持了一项研究，这项研究与意大利地方政府的一个令人费解的主 
题有关 （ Putnam ，1 W 3)。 那项研究的结 论是： 政府和其他社会机构的业绩，受公民 
参与社区事务的强力影响，或者说受我所说的社会资本（沿用科尔曼 （1990) 的说 
法）的强力影响。我现在正打算应用那套观念和洞见，来分析当代美国公共生活的 
—些亟待解决的问题。 

我所说的社会资本，指的是社会生活的特征——网络、规范和信任，这些特征 
使参与者得以更有效地联合行动，以谋求共同的目标。当然，他们的共同目标是否 
值得颂扬，则完全是另外一回事。这些规范、网络和信任将社区的实质性部门连接 


①本版本摘自1995 Uhielde Sola Pool 报告， { 调来 调去: 美国社会资本的奇怪消失》，转载 
自 《政治 科学和政治学>第 664-682 页。此处引用已征得剑桥大学出版社的同意。 
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起来，并跨越潜在的社会裂痕，一旦达到这种程度，即社会资本具有一种“桥梁”作 
用，那么，增进的合作就有可能满足更广泛的利益，并受到广泛欢迎…… 

简言之，社会资本指的是社会联系以及随之而来的规范和信任。从这些联系、 
规范和信任中受益的人——个人、更大的社区或社区内的某一派别——必须在经 
验上而不是在定义上得到确定②……就当下目的而言，我所关心的社会资本类型， 
—般说来，是满足公民目标的社会资本。 

在这个意义上•社会资本与传统意义上的政治参与紧密相关，但这两个术语并 
不同义。政治参与指的是我们与政治机构的关系。社会资本指的是我们每个人相 
互之间的关系。给 PAC 发送支票，是一种政治参与行为，但它并未体现或创造社 
会资本。在一个团队里打保龄球或者同一个朋友喝咖啡，体现并创造了社会资本， 
尽管它们不是政治参与行为（群众的政治运动或传统的城市机关，是一种社会资本 
密集型的政治参与）。我用“公民参与”这个术语，指的是人们与其社区生活之间 
的联系，而不仅仅指与政治的联系。在一种较狹隘的意义上，公民参与跟政治参与 
相关，但它们是否保持同步是一个经验问题，而不具有逻辑必然性。例如，某些形 
式的个体性政治参与（比如 开支粟 捐款）可能处于上升趋势，而与此同时社会联系 
则在减弱。同样，尽讶社会信任（信任他人）与政治信任（信任政治当局）可能在经 
验上相关，但它们在逻辑上明显不同。我很可能信任我的邻居而不信任市政厅，反 
之亦然。 

社会资本理论假定 ：通常 说来，我们与他人联系越多，就越信任他们，反之亦 
然。至少就我目前为止所考察的情况而论，这个假定总的来说被证明是正确 的：社 
会信任与公民参与紧密相关。也就是说，无论是否限定教育、年龄、收人、种族、性 
别等因索，参与（社团或政治）的人总是信任社区或政府的人。③而且，这个道理放 
之四海而皆准，适用于不同国家、美国不同的州、不同的个体、不同种类的群体 。④ 
弄淸楚因果关系的机制——是参与导致信任，还是信任导致参与——在理论和方 
法上都很棘手，尽符布莱姆和瑞恩 （John Brehm & Wendy Kahn ，1995 ) 的报告表明， 
因果关系主要是参与导致信任。也许是吧，但公民联系和社会信任是协同运行的。 
它们以何种方式运行？ 

独舞保龄 球:公 民参与的趋势 

来自大童独立的原始资料的证据强烈地表明，美国社会资本的库存在25年多 


② 在这一方面，我关于社会资本的界定，与科尔曼 （James Coleman ) 关于社会资本的“操 
作”定义稍微有些不同。 参见: Coleman , 1990.300-321. 

③ 本段以及通篇论文所报告的结果，均引自社会普査，除非另有说明。 

④ 从世界价值观调査 （World Values Survey ) ( 1990—1991 ) 得来的关于35个国家的数据表 
明，协会会员数的平均数最与 支持“ 多数人可以信任”这一观点的人数之间的相关系数是 0 65 。 
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来一直在缩减。 

•像 PTA 、 慈善互助俱乐部、妇女投票者联盟、红十字会、工会，甚至保龄球联 
盟这样不同组织的会员纪录表明，许多传统志愿协会的参与，在过去二三十 
年间大致下降了 25% 到50% ( Putnam 1995, 1996)。 

•在1965,1975,1985年对普通美国人的时间预算的调查（该调查记录了全国 
范围内抽样的男女在一天中从事的每一项单一活动）显示，自1965年以来， 
我们花在非正式社交和访问上的时间在减少（大约减少1/4 ) ，而我们花在 
俱乐部和组织上的时间，下降更为明显（大概接近1/2)。 

•尽管在过去三十年间，美国人对政治的兴趣一直穩中有升，而且一些需要动 
笔的参与形式（比如签署诉状和开支票）大量增加，但大量的集体参与举措 
却在悦减 （Rosenstone & Hansen 1993 ； Putnam 1996 ) ，其中包括，出席集会 
或演讲 （1973 —1993年间减少36%)，出席与城镇或学校事务相关的会议 
(减少39%)，为政党工作（减少56% )。 

• 来自社会普查 （ GSS ) 的证据表明，在各个教育层次上以及在男人和女人当 
中，团体会员数自1974年以来大约下降1/4,社会信任自1972年以来大约 
下降1/3。⑤……会员数的锐减使各种团体感到苦恼，从体育俱乐部、专业 
协会到文学讨论小组和劳工同盟，无不如此。⑥……更有甚者，盖洛普民意 
測验报告说，做礼拜的人数在20世纪60年代大约下降了 15% ,而自此以后 
一直保持在一个较低的水平上，但来自全国與论研究中心的教据表明，在 
20世纪七八十年代，下降仍在继续，截至目前总计约 30 % ( Putnam ，1996 ) 。 


为了解释明显的逆向趋势，可能需要对美国社会资本进行一次更为全面的审 
计。例如，一些观察家认为，互助组和街道巡逻组正在增加，几乎没有人否认，过去 
几十年间已经见证了利益集团在华盛顿所呈现出的爆炸性增长趋势 n ……但是， 
这些并非真正意义上的成员相互会面的协会。它们的会员联系仅限于通用的标志 
和意识形态，而不是相互之间的联系。……考虑到各种各样的反例，我认为可资利 
用的有分«的证据证实，当今的美国人和前一代相比，与他们社区的联系显著 
减少。 

当然，大量公民活动依然在我们的社区内随处可见。美国的市民社会并未濒 
临灭亡。事实上，有证据表明，在社区参与及社会信任的程度上，美国仍高于大多 
数其他国家 （ Putnam ， 1996)。但是，如果我们跟我们自己比，不跟其他国家而跟我 


⑤ 对政治当局的信任（事实上还包括对多数社会机构的信任）在过去三十年间同样急剧 
下降，但这种下降在概念上是一种截然不同的趋势。我们从下文将看到，社会信任下降的原因 
和政治信任下降的原因完全不同。 

⑥ 出于下文所解释的原因，图丨报告了各种类型团体中的会员数的趋势，条件是限定应答 
者的教育水平。 
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们的父辈比，最有力的证据都表明，我们彼此间的联系在减少。 

本序言提出大 M 值得深入探讨的重要 问题： 

• 美国社会资本的库存真的减少了吗？ 

• 它要紧不？ 

• 我们能够对它做些什么？ 

在我看来，对前两个问题的回答是肯定的，但我无法在此深人处理它们。最终 
使我最为关心的是对第三个问题的回答，这一答案至少在某种程度上首先取 决于, 
我们对扰乱美国公民生活的奇怪弊病的原因的理解。这正是我打算在此解开的那 
个谜 ：为什 么美国社区生活的组织结构，在 20 世纪 60 年代开始削减，并在七八十 
年代进一步加剧？为什么越来越多的美国人独自打保龄球？ 

对社会资本减少的解释 

这个谜题有多种可能 解答： 

•繁 忙和时间压力 

• 经济上的难关（根据一些备选理论的观点，或者是物质富裕） 

• 住所机动性 
• 郊区化 

• 妇女成为有偿劳动力以及双职工家庭的重担 
•婚姻和家庭关系的破裂 

• 美国经济结构的变化，比如 连销店 、分公司和服务业的增加 
•20 世纪60年代（大多数实际上发生在20世纪70年代），包括 

-越南战争、水门 事件 ，以及对公共生活的理想的幻灭 

——反抗权威的文化叛逆（性 、毒 品等） 

•福利国家的增多 
• 民权革命 

• 电视、电子革命及其他技术变革 

大多数有名望的侦探作家，都不愿意清点这么多看似可能的嫌疑对象，无论虚 

构的侦探多么能干。说实话，我无法处理上述所有理论——当然是指不能以权威 

的方式处理，但我们必须开始筛选这个清单。可以肯定，与我们正在研究的那种趋 

势一样普遍的某种社会趋势，可能有多重原因，因此我们的任务是评估这些因素的 
相对重要性。 

解开我们谜题的某种途径，即使不全面，也须通过若干 测试。 

所提出的解释因索是否与信任及公民参与相关？ 如果不相关，就很难明白 ，为 
什么这个因素还被列入这个清单中。例如，许多妇女在我们尚在讨论的那—时期， 
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已经成为有偿劳动力，但是，如果职业女性被证明比家庭主妇更投人社区生活，那 
么，就很难将社区组织中的下降趋势归因为双职工家庭的增多。 

这种相关是虚假的吗？ 例如，如果有子女的家长比无子女的人更有可能成为 
参与者，那么这将成为一个重要的线索。但是，如果家长身份与公民参与之间的相 
关被证明是完全虚假的，例如，由于年龄的影响，我们将不得不把下降的出生率从 
我们的怀疑清单中剔除。 

所提出的解释因素是否以相应的方式发生改变？ 例如，假设经常搬迁的人具 
有较浅的社区根基。那么，只有当住所机动性本身在这一时期上升时，上述假设才 
能成为解答我们的谜的答案的一个重要部分。 

所提出的解释因素可能会遭受如此诘难吗？即它可能是公民不参与的结果， 
而非 原因。 例如，即便报纸读者群跨越个体和时代限制，与公民参与紧密相关，我 
们也有必要权衡下列可能 性：报 纸发行屋:的削减是不参与的结果（而非原因）。 

依据上述那套基准，我们来考虑影响社会资本形成的各种潜在因家。 

教育 

人力资本和社会资本紧密相关，因为教育对信任、协会会员，以及许多其他形 
式的社会和政治参与，均具有强烈影响。时至今日，教育是我所发现的各种形式的 
公民参与（包括社会信任以及许多不同类型的团体中的会员数）的最牢固的相关 
项。⑦……简言之，教育是预测公民参与的一个有力指标。…… 

在某种程度上，教育代表了社会阶层和经济的差异，但是，当收入、社会地位和 
教疗被同时用来预测信任和团体会员数时，教育仍是首要的影响因索。……简言 
之，受教育程度商的人，更有可能成为参与者与信任者，部分原因在于他们经济上 
更贫裕，但主要还是因为他们在家及在学校所接受的技能、才略与爱好。 

人们符遍认为，当今的美国人要比我们的父辈和祖辈受到更好的教育。然而 
却很少意识到，这种趋势在刚刚过去的20年间如何对成年人的教育构成带来巨大 
而又迅速的改变。自1972年以来，所有成年人中受过12年以上教育的人所占的 
比例几乎翻倍，从28%上涨到50%。…… 

这么看来，教育急剧地推进了公民参与，教育水平也大幅度提升。不幸的是， 
这两个无可否认的事实，只会加深我们的主要疑惑。照理说，在过去20年间，教育 
水平的提升本应该增加社会资本……但与之相反，自20世纪70年代初以來，实际 
的 GSS 数据表明，社会资本呈净下降趋势。…… 

因此，上述第一种研究尝试加深了我们的 困惑。 尽管如此，我们还是可以从上 


⑦唯一的例外是庄园集团、劳工同盟和退伍军人组织，它们的成员所接受的正规教育比普 
通美国人要稍微少一些。 
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述发现中得出两个有用的结论，一个是方法论上的，一个是实质性的： 

1. 既然教育对公民参与和社会信任有如此强烈的影响，那么，我们在考察其他 
的可能因素时，就有必要说明教育的差异，目的是要确保，我们不会把教育 
的结果与其他变量的可能影响混淆起来。 

2. 无论公民参与和社会信任驟降的背后存在何种力量，这些力量已经影响到 
美国社会的各个层面。过去25年间，令人费解的不参与似乎已经使我们社 
会的所有阶层都感到苦恼…… 


时间和金钱的压力 


当今的美国人的确觉得比上一代人更忙碌：20世纪60年代中期至90年代中 
期，我们这代人中报告说感觉“总是很匆忙”的人数比例大幅度上涨 （Robinson & 
Godbey ,1995)。 我们倾向于逃离社区亊务，或许，隐藏在这种倾向背后的、最明显 
的嫌疑对象，就是到处充斥的繁忙。而且，潜藏在幽暗处附近的，正是那些我们今 
天已大佾讨论过的我们社会所特有的经济压力——工作不安全感和实际工资的下 
降，尤其是在收入处于低2/3部分的人当中。 

然而，尽管繁忙和经济上的不安全感乍一肴似乎应受到 at 资，但我们很难找到 
将其定罪的证据。事实上，证据的天平有力地 S 示：对 我们设法要解开的那个谜题 
而言，时间和金钱压力显然不是帘要的促成因索。 

首先，时间预算研究并未证实这一论 点：即 平均说来美国人比上一代人工作时 
间更长。相反，罗宾逊和戈德贝 （Hubinson and Godbey , 1995 ) 报告说， 1965—1985 
年间，普通美国人平均每周多贏得5小时空闲时间，部分是因为花在家务上的时间 
减少，部分因为较早退休。他们宣称，当今美国人比几十年前拥有更多空闲时间， 
奄无疑问，这一论断会逍到其他观察家的质疑。例如，绍尔 （ Schor ,1991 ) 的报告证 
实，我们的工作时间在加长，尤其是对妇女而言。然而，不管上述争论的解决途径 
是什么，仅仅凭借工作时间与社会信任及团体会员之间的相关性考察，就将公民不 
参与归咎于工作日的延长，这个论点更不合理。 

可资利用的证据强烈 显示： 事实上，长时间的工作与公民生活参与的减少或社 
会信任的减少并没有关联。完全相反 ：来自 社会普査的结果表明，相比那些不在有 
偿劳动力之列的人而言，就业一族加人的团体还稍微要多些。尤为令人震惊的是 
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这一事实 ：较长 的工作时间与更多的（而非更少的）公民参与相联系。⑧这一惊人 
发现，与来自时间预算研究的证据完全符合。罗宾逊 （ Robinson ，1990 a ) 报告 说：不 
足为奇，花更多时间投人工作的人的确感觉更匆忙，这些饱受折磨的人，在吃饭、睡 
觉读书 、从事业余爱好，甚至无所事事方面，的确只花更少的时间。与其他人相 
比，他们花在看电视±1的时间少得更多——几乎少了 30%。然而，他们花在组织 
活动上的时间并没有减少…… 

……而且，全国范围内的参与和信任的下降，在全职工作者、兼职工作者，以及 
在那些不在有偿劳动力之列的工作者当中，均有相当体现。因此，即使人们正摆脱 
社区生活，延长的（工作）时间似乎也不能成为理由。 

如果时间压力不是我们要寻求的根源，经济压力又会如何？……相比穷人和 
中层收入的工薪族而言，在更富裕的一部分美国公民中，参与和信任方面的下降实 
际上还略微严重一些。……总之，无论是客观的还是主观的经济安乐，均不能使美 
国人预防公民不参与的病毐；甚至正相反，南裕在一定程度上加剧了这个问题的恶 
化…… 


流动性和郊区化 

大《：研究已经发现，住所稳定性以及相关现象 （ 比如，私房业主）与更多的公 
民参与相关。在调査研究的早期阶段 （Putnam 1995, 30 ), 我发现“与植物的频繁 
移植一样，流动性往往会破坏根部系统，而一个背并离乡的个体要种下新的根基滿 
要花贽时间”。但我现在必须报告说，深入的调査完全可以证明，住所流动性不应 
当对公民参与的下降负任何责任。来自美国人口符査局1995年（和早些年）的数 
据显示，住所流动率在过去半个世纪一直相当平稳。事实上，非要说存在任何变化 
的话，也只能说长短距离的流动在过去50年间均呈下降趋势。在20世纪50年 
代，每年有20%的美国人变换住所 ,6. 9%的美国人跨州迁移；在90年代，同比数字 
分别为17%和6.6%。总之，当今的美国人相比前一代人而言，住所更稳定。如果 
有关经济萧条解释的定论还得更精确的话，那么，关于流动性的定论是一清二楚 
的。这个理论就是错的。 

但是，如果迁移本身并未侵蚀我们的社会资本，那么下列可能性又如何 ：我们 


⑧无论是否限定教育和调査年份，这一事实都是对的。在男性和女性当中，关于这个分值 
的模型是不同的，因为兼职妇女比全职或足不出户的妇女，在公民参与和社会信任方面，稍微更 
积极一些。不管我们怎样对待这种让人感兴趣的反常现象,它显然并未出现在时间预算数据中 
(Robinson & Godbey ,1995) ，而且在男性当中，情况亦然,这种反常无法解释我们基本的谜题，因 
为兼职女性在美国总人口中所占的比例相对较少，而这一比例在增长，而不是在下降。 GSS 数 
据显示，20世纪70年代前半期至90年代前半期，兼职女性在整个成年人口中所占的比重，由近 
8% 上升至近 10%。 
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一直往那些更不适宜社会联系的地方（尤其是郊区）迁移？为了检验这一理论，我 
们必须首先研究居住地和社会资本之间的相关性。事实上，社会联系的确因社区 
类型而异，但这些差异被证明是适度的，而且与上述理论背道而驰…… 


妇女角色的转换 


大多数（我这一代人的）母亲都是家庭主妇，而且她们大都在社会资本形成上 
有很重的投资。这里所说的投资是一种专门用语，指的是在教会晚餐、 PTA 会议、 
邻里咖啡聚会，以及拜访亲朋好友等方面所耗费的不计其数的、不计报酬的时间。 
妇女离家并成为有偿劳动力，这一潮流也许是过去半个世纪最不寻常的社会变化。 
无论女权革命多么受欢迎或多么过时，我们都很难相信它未曾对社会联系产生任 
何影响。难道这是过去25〜30年间社会资本下降的首要原因？ 

可资利用的调査证据中，某些模型似乎支持这一主张。考虑到各种因家，女人 
从 W 的 自愿协 会比男人稍微少一些 （ Edwmxk , Edwards & Watts , 1984) 0 另一方面， 
时间耗用研究表明，相比男人而言，女人在那些团体以及非正式的社会联系上要花 
去更多时间 （Robinson & Godbey ,1995)。 尽宵参与和信任方面的绝对下泄在男人 
和女人当中几乎相等，但相对下滑在女人当中稍微严重一些。限定教育因索，那 
么，男人当中的会员数每十年以10%〜15%的比例下降，而女人当中的同比下降比 
例为20%〜25% . 

但是，诚如我们先前所见，工作状况本身对团体会员数或信任所产生的净影响 
似乎很小。相对于职业女性而言，家庭主妇 从厲于 各种不同类型的团体（例如，更 
多的 PTA , 以及较少的专业协会），但在总数上，职业女性实际上自愿加人的协会要 
稍微多一些。⑨更为重要的是，公民参与的总体下滑在家庭主妇中要比在职业女 
性中更严重。1965和1985年的时间耗用数据的对比 （Robinson & Godbey ,1995) 
似乎表明，职业女性作为一个群体，在组织上所花的时间较之以前实际上更多，而 
非职业女性花的时间则更少。同样的研究表明，自1965年以来，非正式社交中的 
主要下滑也集中在无业女性当中。当然，主要事实还在 于：对 各类女性而言，总趋 
势是下降的（对男人而言同样如此，甚至还包括单身汉），但数据显示，相比非全职 
工作的妇女而言，全职工作的妇女对这种下滑趋势实际上更具免疫力。 

如此看来，妇女似乎应当对公民参与在过去20年间的下降承担一定的责任， 
尽管如此，我们还是很难找到微观层次上的数据，将上述事实与妇女加人劳动力大 


⑨但是，罗宾逊和戈德贝 （Robinson and Godbey ，1995) 报告说，相对于职业女性而言，非职 
业女性仍然会花更多时间来参与自愿性协会的活动。 
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军联系起来。当然，我们很难控制这些数据中的选择偏差，因为那些已经决定加入 
劳动力大军的妇女，毫无疑问，在许多方面不同于那些已经决定居家的妇女。社区 
参与之所以在职业女性当中似乎在增加而在家庭主妇当中似乎又在下降，其中一 
个原因或许就 在于： 正是那些在早些年代最频繁参与社区事务的妇女，最可能加人 
劳动力大军，其结果同时也就降低了公民参与在剩余那部分家庭主妇中的平均水 
平，而同时又提高了职业女性公民参与的平均水平。很明显，一直以来我们并未进 
行一项重大的全国性的控制实验，以研究工作对女性公民参与的影响，而且不管怎 
么说，数据模型尚不完全淸楚。但是，与我本人的早期推测相反，我几乎找不到任 
何证据支持这个假说 :在过 去的一代中，妇女加入劳动力大军的潮流，已经对社会 
联系和公民参与产生了重要影响。另一方面，我也找不到任何明晰的转代性说明 
以解释这一 亊实： 公民参与的相对下滑，在女人当中要比在男人当中更严重。既然 
这种证据至多是间接性的，那么，我们在此所能作出的最好的暂行判断，也许就是 
著名的苏格兰式裁 决：证 据不足，暂不定罪。 

婚姻和家庭 

另外一种广受讨论的、与公民参与的下降多少有点关联的社会 趋势就 是传统 
家庭单位（妈妈、爸爸和孩子）的瓦解。根据某些解释，既然家庭本身是社会资本 
的一种关键形式，那么，也许它的消逝是参与和信任在较大社区内下降的部分解 
释。证据表明什么？ 

首先，家庭纽带松弛的证据是显而易见的。长达一个世纪的离婚率的上升 （20 
世纪60年代中期至70年代中期加速增长，随后趋于平稳），单亲家庭近来也不断 
增多，除此之外，单人家庭的发生率自1950年以来已经翻了一倍多，部分原因在于 
单独生活的寡妇数量的上升 （ Caplow , Bahr , Modell , and Chadwick 1991, 47，106, 
113)。 正如社会普査所反映的那样，所有这些变化的净效应就 在于： 所有美国成年 
人中，目前尚未结婚的人数比例由1974年的28%，攀升至1994年的48%。 

其次，已婚男女在我们关于社会资本的两种测馈中，的确处在稍高的等级上。 
也就是说，限定教育、年龄、种族等因素，单身族（离婚的、分居的，以及从未结婚的 
男女）比已婚族明显更不信任他人，也更不热衷公民参与。⑩大致说来，与单身男 
女相比，已婚男女的对外信任度大约高1/3,而他们所从厲的团体大约多15%〜 
25%。（在这项比较中，寡妇和鳏夫更像已婚族而非单身族） 


⑩多重变量分析有迹象表明，离婚使社会联系下降的一个主要原因就在于，它降低了家庭 
收入，这反过来又降低了公民参与。 
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总而言之，成功的婚姻（尤其是当这个家庭单位还包括孩子时），在统计上与 
更多的社会信任和公民参与相关。因此，信任和会员数的部分下降，与婚姻率的下 
降有关…… 

我本人的断定是（一定程度上以下文引人的额外证据为基础），婚姻的破裂或 
许是本文幵头提到的那宗罪行的从犯，而非主犯。 


福利国家的兴起 

在一些评论家看来（例如， Fukuyama , 1995, 313-314) ，间接证据，尤其是关于社会 
联系下降的定时统计，已经表明，公民不参与的一个重要原因（甚或正是这个原因）就 
是大政府和福利国家的壮大。据称，通过对个人主动性的“驱除”，国家干预已 颠覆了 
市民社会。这个题目太大，我无法在此详述，只是提出一两点适当的看法。 

—方面，几乎可以#定，某些政府政策已造成社会资本的破坏。例如，20世纪 
50年代和60年代的所谓的“贫民窟淸除”政策，切断业已存在社区纽带。还可以 
设想，一些社会支出和税收政策，可能已经对热心公益的慈善事业造成了障碍 n 另 
—方面，我们又很难看出，哪些政府政策应该对保龄球联盟和文学俱乐郎的袞落 
负责。 

解决上述问题的一种经验途径，就是考察公民参与的差异，以及跨不同政治轱 
区的公共政策，以便弄淸楚臃肿的政府是否会导致社会资本的缩减。然而，在美国 
各州，社会资本的差异与各种关于福利支出或政府规模的测撤，表面 肴来并 没有本 
质的关联。⑪…… 


种族和民权革命 


种族是美国社会史的一个绝对根本的特征，这个社会的几乎所有其他的特征 
都以某种方式同它相关联。因此，我们似乎可以在直觉上合理地认为，种族对持续 
—代之久的社会资本的削减，可能在一定程度上产生了影响。事实上，一些观察家 
(包括黑人和白人）已经注意到，恰恰就是在20世纪60年代的民权革命取得最辉 
煌的成功之后，社会联系和社会信任开始下滑。在某些观察家看来，上述巧合已经 


⑪我会在以后的著作中更详尽地处理这个问题，但对以下纪录，我要着重指出：（丨）社会 
信任和团体会员数的国家层面上的差异，是实质性的、紧密相关的，并且是适度平稳的，至少 20 
世纪70—90年代这一时期是 如此； （2) 根据 Elazer (1966) 所发明的关于“国家政治文化”的测 
量，上述那些差异惊人地紧密相关 （# =0. 52 ),Sharkansky (1969) 基于对整个50年代的国家政 
治的描述性说明，对 Elazei ■的测量进行了改进，而这种改迸反过来又可追溯至丨 9 世纪及其以前 
的移民模型。 
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间接表明了一种社会学意义上的“白人逃亡”的可能性，因为公民生活中法定废除 

种族隔离，致使白人从社区协会中退出。 、 

与关于福利国家的理论一样，上述对社会资本破坏的种族性解释相当有争议， 
仅靠上述简短评论，几乎无法解决这一争议。尽管如此，基本的事实还是这些。 

首先，协会会员间的种族差异并不大。……而另一方面，种族差异在社会信任 
方面的确相当大，即使考虑到教育、收人等的差异，情况亦然。平均说来，在1 972 一 
1994年间，限定教育差异，大约有17%的黑人支持“多数人是可信的”这个观点，相 
比而言，大约45%的白人赞同这一观点，大约27%的其他种族的人认同这一观 
点。⑫当然，社会信任方面的这些种族差异，反映的并不是集体偏执，而是贯穿多 
代人的真实经历。 

其次，社会资本的削减已影响到所有种族。 . 尤为重要的是，不参与在白人 

中的发展速度，与种族互斥或对种族隔离的支持，一直毫不相关。相比更宽容的白 
人而言，公然的种族主义者或主张隔离主义的白人，在这一时期并没有更快地脱离 
社区组织。……这个证据还表明，废除过去30年的民权进展，还是无法挽回社会 

资本的损失。 


代际效应 


我们一直在竭力找出公民不参与的根源，可我们的努力目前为止并未取彳线突 

出进展。下降趋势一如既往地贾穿美国社会的主要领域。 . 然而，一个明显的 

例外涉及年龄。在我们所有的统计分析中，作为所有形式的公民参与和信任的一 
个预测因素，年龄仅次于教育。老人比年轻 人从厲 于更多的组织，并且他们很少会 
愤世嫉俗。而且，年长的美国人更经常地参与投栗，更频繁地读报，这是与参与和 
信任紧密相关的另外两种形式的公民参与。……大多数评论家都将这种模式解释 
为一种生命周期现象，我最初也这么认为。 

来自社会普査 （ GSS ) 的证据使我们能够随着个体的老化来了解他们的年龄 
组。……然而，令人吃惊的是，这种分析（不断地被用于研究在各个连续的年龄段 
出生的个体）并未提供任何有效证据证明公民参与中的生命周期变化。事实上，更 
常见的情况是 ：当几 代人都经历了 1972—1994 这一时期时，他们的信任度和会员 
数不升反降，这种情况反映出，公民参与在年轻人以及在老人当中存在一定程度的 
同时性下滑，80年代后半期尤为明显。但是，上述下降趋势明显不能解释，为什么 
经历过那一时期的年长美国人，信任度和参与度往往会更高。事实上，根据这些数 
据，我们唯一可发现的可靠的生命周期效应就 是：当 我们走过我们自己的80年代 
时，我们会在垂暮之年退出公民参与。 


⑫与本文别处的用法一样，这里所说的“限定教育差异”是指,对少于12年、正好12年，以 
及多于12年学龄的应答者的平均分值，分别进行平均化。 
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这些模型所暴露的一个主要悖论是这样的 ：老年 人比年轻人一向都更积极地 
投入公民参与，而且也更信任他人，然而，随着我们逐渐老化，我们并未变得更积 
极，也更不信任他人。到底出了什么问题？ 

时间和年龄对社会行为的影响相当模糊。社会科学家已经认识到，要区分三 
种截然不同的 现象： 

1 . 生命周期效应所体现的差异，可归为不同的生命阶段。在这种情况下，个体 
随着年岁增长而发生改变，但是，出生和死亡的“人口统计上的新陈代谢”， 
使老化效应总体上趋于勾称的平衡，因此，生命周期效应并未发生总体改 
变。随着年岁增长，我们每个人的近距视力都会下降，但对放大娩的总体需 
求几乎没有变化。 

2. 时期效应对经历过某一特定时代的所有人均产生影响，不管他们的年龄如 
何。⑬时期效应既能引起个体改变，又能引起总体改变，这种影响通常迅速而又 
持久，并且无视与年龄相关的差异。例如，1965—1975年间，人们对政府的信任 
急剧下滑，这种趋势基本上属于这种时期效应，因为各个年龄段的美国人，都改 
变了他们对其领导人可信度的看法。同样，正如我们刚刚所注意到的那样，社会 
资本在20世纪80年代所出现的适度下滑，似乎也是一种时期效应。 

3. 代际效应，正如曼海姆 （Karl Mannheim ) 在其经典论文《代的问题》 （ 7 Vif * 

Problem of Generations ) 中所描述的那样，代表着这一事实-“属于同一代 

人的个体，只要出生年份相同，那么，他们在社会进程的历史维度中，就会被 
賦予共同的定位” （ Mannheim , 1952, 290) 0 与生命周期效应一样（不同于 
典型的时期效应），代际效应表现为年龄群组在某一单一时间点上的差异， 
但与时期效应一样（不同于生命周期效应），代际效应引起真实的社会改 
变，因为•被深深打上不同現点“ 烙印” 的一代又一代的人，总是你方唱罢我 
登场，接连不断地登上历史舞台。在纯粹的代际效应中，个体从未改变，但 
社会却发生了改变。 

. 回到我们的难题，倘若年长的人想当初并未随着年岁增长而变得更积极 

地投身于公民参与并且更信任他人，那么，他们今天又如何会变得更积极而又更信 
任他人呢？正如巴特勒和斯特克斯 （David Butler & Donald Stokes ，1974 ) 在另外 一 
种语境下所注意到的那样，解决这个悖论的关键，不是追问人们现在多大年龄，而 
是追问他们何时年轻。图1再现了这个问题，它表明了根据被调査者的出生年份 
所进行的各种关于公民参与的测鳗。⑭…… 


⑬只对特定年龄段的人产生影响的时期影响会逐渐变成代际效应，这正是康弗斯 
( Converse ) 在概括与年龄相关的效应时，仅提到“两个半”类型而非传统的三种类型的原因所在。 

⑭为 r 排除生命晚期中的生命周期效应，图1不包括80岁以上的调查对象。为了避免在 
对青年人进行可靠抽样时所存在的众所周知的问题，康弗斯 （ Con Veree ， 1976〉曾就这些问题做 
过讨论，图1同样不包括25岁以下的调査 对象， 为了弥补相对较小的逐年样本的不足,并且为 
了限定教育差异，图1绘制出五年移动平均线，它们横切本文所运用的三种教育范畴。 
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漫长的公民代 

实际上，图1从左至右按照出生日期将美国人排成一线 ：起点 是那些出生在19 
世纪后30年的人，并且一直延续至他们的曾孙一代，也就是20世纪最后30年出 
生的一代人。当我们沿着这条横轴从左至右（从那些在世纪之交长大的人，到在兴 
旺的20年代成长的人，以此类推）移动时，我们发现，公民参与和社会信任保持一 
种相对较高且又不平稳的上升趋势。然而，我们接下来就看到社会参与相当突然 
地减少的迹象，始于出生于20世纪30年代早期的男女。值得注意的是，参与、信 
任、投槳及读报中的这种下降趋势，几乎不间断地持续了近40年。公民参与的各 
种不同指标的轨迹惊人地平行••对于出生且成长于20世纪前30年的人而言，每一 
轨迹都表明一种瘅的、有时是上升的稳定 态势; 20世纪30年代左右出生的年龄群 
组中，每一轨迹都呈现出一个转 折点； 而且，每一轨迹随后都表现出程度不—的持 
续下降趋势，一直延续至60年代出生的年龄群组。⑮ 

不符根据哪种标准，这些代际差异都是异乎寻常的。举个例子，我们来比较岀 
生于20世纪20年代早期的一代人和出生于20世纪 6 0年代的他们的孙子辈的一 
代人。限定教疗差异，那么，出生于20世纪20年代的一代人，加入公民协会的会 
员人数几乎是岀生于20世纪60年代的那些人的两倍 （前 者人均会员数约为 1.9, 
后者约为 1.1)。 祖父辈更有可能信任他人，其中信任他人的人数比例是他们孙子 
辈的两倍多（50%〜60%对25%)。他们参与投票的人数比例几乎是最近年龄群 
组的两倍（约75%对40%〜 4 5%)，而且，他们读报的人数几乎是通常读报人数的 
3倍（每天都读报的比例是70%〜80%对25%〜30%)。记住 ：我们 尚未找到任何 

证据，证明年轻的一代人随着年岁增长，最终将与他们祖父辈较商程度的公民参 
与相匹配。 

因此，对我们的基本谜题而言，我们的数据中与年龄相关的模型提出了一种完 
全不同的解 释：不 能将这些模型理解为生命周期效应，而应理解为代际效应。用这 
种方法解释，图丨描述了一个漫长的“公民”代，这代人出生于 1910—1940 年间，这 
是一个广泛的群体，比起年轻一代，他们更多地参与社区事务，而且从根本上也更 


⑮在社会普査的数据中发现公民参与的代际差异之后，我们才获悉了米勒/夏克斯 
( Miller / Shanks ) 的论点，但他们的发现与我的发现惊人地 一致。 
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信任他人。⑯这一公民代的顶峰是出生于 1925—1930 年间的年龄群组，他们在美 
国经济大萧条期间上小学，在高中（或在战场上）经历了第二次世界大战，在 1948 
年或 1952 年首次投票，在 20 世纪 50 年代成家立业，并且在二三十岁以后才首次 
看电视。由于全国调査已开始，这代人一直格外具有公民精神 ：更多 地投票、更多 
地参与、更多地读报、更多地信任他人。正如著名的社会学家蒂利（生于 1928 年）， 
在评论本文的早期版本时所说的那样，“我们是最后的乳儿”。 

为了有 助于解释代代相连的美国人在其中成长起来的历史背景，图1还指出 
了每一年龄群组在其中得到法定年龄的十进制期限。因此，我们可以看出，20世 
纪 4 0年代后成年的每一代人，均比其相邻的前一代人，更少地参与公民事务。 

，这种代际解释的进一步证实来自两条平行线的比较，这两条平行线在图中 
均表示对同一个社会信任问题的回应，最初是在全国选举研究 （ NES )( 主要在 
1964—1976年间）中被提出，随后又在 1972—1994 年间的社会普査 （ GSS ) 中被提 
出。⑫如果生于20世纪初的美国人所表现出的更岛程度的信任代表一种生命周期 
效应的话，那么来自 GSS _査（当时被调査对象的平均年龄为10岁）的曲线，本应 
该在 NES 线条之上间隔一定 距离， 实际情况却是， GSS 线条大约比 NES 线条低 
5 % 0 %。儿乎可以诗定，这种向下的转变代表一种时期效应，它导致社会信任 
在20世纪80年代的各个年龄组的人群中都呈下降趋势。⑯但是，这种下降的期间 
效应，比起我们已注意到的巨大的代际差异而言，实质上要适度得多。 

简言之，对公民参与中与年龄相关的差异所做的最简洁的解释就 是：这 些差异 
代表 y 公民参与在二战后的几十年间成年的美国人当中的一种急剧的下降，而且 
还代表狞一•定程度的不参与，这些不参与影响到20世纪80年代的各个年龄段的 
人。这些模型提示我们，在二战后成民与在水门事件之前成长，是一种完全不同的 
经历。战后的各代人似乎被掳露在某种神秘的 X 射线之下•这种神秘的 X 射线持 
久而又不断地促使他们更不可能与社区保持联系。无论那种力麻是什么，这种力 
M (而非发生于20世纪70和80年代的任何事悄）还是解释了大部分的公民离散， 


⑯在 20 世纪 *70 年代和 80 年代所进行的调査中，几乎不包括生于 19 世纪晚期的调査对 

象，以至于我们无，可靠地辨别连续出生的年龄群组中的差异。但是，那些不充分的数据 （并未 

出现在图 1 中）显示，世纪之交可能曾是公民参与上升的一个时期。同样 .1970 年后出生的调査 

对象儿乎也未出现在全国调査中，以至于我们很难确定他们独特的世代性 槪貌尽 管截至目前 

有微弱的结果表明，在公民参与方面， 40 年一代的下降可能正停止下跌并即将回升。然而，即使 

这一点被证明是正确的，上述发展要抑制公民参与的总体下降，可能还需要几十年的时间，原因 
下文给出。 

⑫ 1910—1940 年间的这一代人的成员比他们的上一辈似乎也更具公民精神，至少根据出 
现在我们样本中的生于 19 世纪晚期的相对较少的那部分男女的观点来判断，情况如此。 

⑬在丨 964— 1976 年间所迸行的全国选举调査中，与社会信任相关的问题每两年就会出 
现，随后又在 1992 年的调査中再次出现。在分析过程中，我将 1992 年的 NES 的访谈也包括进 

来，目的就是要获得关于这样一些同一年龄段群组的估计数据，在早期所进行的调査中，这些人 
当时还太年轻，并未被包括进去。 — 



ii 4 社会科学研究的思维要素 

这些公民离散是我们谜团的核心部分。 


重述这个谜 

当代美国的公民不参与很大程度上具有世代性，这样说只是重新阐述了我们 
的主要谜题。我们现在知道，我们独自打保龄球的大部分原因，可能要追溯至20 
世纪 4 0和50年代，而不是60和70年代。那种神秘的反公民的“ X 射线”是什么？ 
它已影响到二战后成年的美国人，至少在进人70年代以后，其影响还在不断地加 
深。⑮…… 

我已经注意到唯一的一个明显的可疑对象，我准备动用间接证据向它发起攻 
击。……罪魁祸首就是电视。 

首先，向它发起攻击的时机已到。漫长的公民一代，是最后一代并未伴随电视 
而成长起来的美国公民，因为电视与照明一样，在20世纪50年代才突然进人美国 
社会。在1950年，勉强有10%的美国家庭拥有电视机，但到了 1959年，90%的家 
庭都有电视机，这或许是先前所记录的最迅猛的技术革新扩散。这种雷光电掣般 
的扩散，所造成的余波持续了几十年，比如，整个20世纪60年代，人均看电视的时 
间增长17% ~20%，而整个70年代又在这个基础上增长了 7% ~8%。早些年，楫 
电视主要集中于受教育程度较低的群体，但在整个20世纪70年代，受教疗程度较 
岛的群体释电视的时间也开始呈上升趋势。看电视的时间随年龄（尤其是退休以 
后）而增长，但是，由于电视的引进，每一代人都在一个较高的起点上开始其生命周 
期。截止到1995年，每一电视用户肴电视的时间，比其在20 世纪 50年代要商出 
50% 多。® 


⑬ GSS 对公民参与指标的其他分析 （ 本文并未详细报告）证实了 20世纪80年代中的这种 
向下的转变。 

⑳我在此记录的一个学说，要分别归功于 Robert Salisbury ( 1985), Gerald Gamm , and 
Simon & Garfunkelo 全民娱乐的爱好者可能还记得，迪马乔 （Joe Dimaggio ) 1936年与洋基队 
( Yankees ) 签约，当时，漫长公民一代的最后一批人才刚刚参与捧球运动，而他于 W51 年将中外 
场交给曼托 （Mickey Mantle ) 负责，这个时候恰恰又是最后的“乳儿”达到法定成年年龄的时候。 
几乎 M 时性地， Braves ， Athletics , Browns , Senators , Dodgers , 以及 Giants 等队都放弃了自己的主 
场城市，这些城市自19世纪晚期以来就一直是它们的主场。当曼托于1968年离开洋基队时，对 
公民忠诚造成极大伤害。这种解释说明了，为什么罗宾逊夫人的悲伤的疑问[与乔廷 • 乔 （ J 0 hi n 
Joe ) 那年的下落有关]，会引起如此广泛的共鸣。关于社会资本下降的一种解构主义的分析，突 
出了最后难以忘怀的哀叹一“我们的国家用孤独无助的眼神望着你”。 
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大 M 研究估计，普通美国人如今每天看电视的时间大约是4个小时。 ㉑ 罗宾逊 
( Robinson , 1990 b ) 运用比较保守的时间耗用技术（用以确定人们如何分配他们的 
时间），提供的一个估计数字是每天接近3 小时； 但他承认，作为一种主要活动，看 
电视占用普通美国人40%的自由时间，这一比例自1965年以来又大约上涨1/3。 
而且，复合设备已经 蔓延： 截止到20世纪80年代末,3/4的全美家庭都拥有不止一 
套的电视设备 （ Com S t oc k ， l 9 89)， 而这个数字还在稳定上升。总之，正如罗宾逊和 
戈德贝 （Robinson & Godbey ,1995) 所断言的那样，“电视威力无比，它侵占了人们大 
鼠的空闲时间”。美国人度过白昼和黑夜的方式已发生大规模变化，这种变化正好 
出现在世代性的公民不参与的那些年中。 

然而，电视来临和社会联系削弱发生关联的证据并不仅仅是间接性的。公民 
参与和电视收看之间的关系可以同公民参与和报纸阅读之间的关系相比较，这种 
比较具有启发意义。基本的对比简单 明了： 报纸阅读与高 数掛的 社会资本相关，电 
视收看与 低数® 的社会资本相关。 

限定教育、收入、年龄、种族、住所、工作状况以及性别等变掛，那么，电视收看 
与社会资本及团体会员数之间具有很强的负相关性，而社会资本及团体会员数与 
报纸阅读之间则具有正相关性。…… 

电视如何破坏社会资本？ 

• 时间置换。尽管每个人的一天中都只有24小时，但多数形式的社会和媒介 
参与依然是正相关的。聆听大量古典音乐的人，比其他人更有可能 （ 并非更 

不可能）参加 Cubs 比赛。电视是上述概括的一个首要例外-它是唯一的 

一种可能会禁止户外参与的休闲活动。电视收看所导致的结果，往往是牺 
牲几乎所有的户外社会活动，尤其是社会集会和非正式交谈 （Comstock et 
al . 1978; Comstock 1989; Bower 1985 ； and Robinson & God bey 1995 ) 0 电视 
观众就是有恋家癣的人。 . 

• 在加拿大的三个城市所进行的一项重要的与电視引进有关的准实验研究 
(Williams 1986) ，在跨时间的总体水平上发现了同样的 模型： 电视出现的一 
个主要影响就是导致社会、妷乐及社区活动的参与在所有年龄段的人群中 
都呈下降趋势。简言之，电视正将我们的闲暇时间私有化。 

• 对观众视野的影响。一个令人印象深刻的文学团体（在“小人世界效应，，的 
指导下聚集在一起）认为，过量現看电视的人，异乎寻常地怀疑他人的善 

行-例如，过高估计犯罪率。这个文学团体就深层的因果模式产生了大 

量争论，其中一些怀疑论者认为，上述那种遁世心理可能助长了电视迷的行 


㉑ 有关电视社会学方面的大*文献的介绍，可参见 Bower ( 1985 )， Comstock et al . 
(1978 )，Comstock (1989), and Grabner (丨 993)。 本文出现的收视时间方面的数据，均引自 
Bower (1985, 33) 以及<公共视点》 （ m/ic 1995， 47) 这本书。年龄群组的差异也引 

自 Bower (1985, 46) 的报告。 
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为，反之不然。然而，在等待更好的实验证据的同时，我们还是可以接受一 
个合理的暂行判 断：过 量的电视收看很可能会增加关于人性的悲观想法 
(Gerbner et al . , 1980; Dobb & MacDonald 1979 ； Hirsh 1980; and Comstock 
1989, 265-69) 0 . 

• 对孩子们的影响。电视在孩子们的生活中充当特别的角色-他们平均每 

周要耗费40小时的时间来看电视。收视率在青春期以前的孩子们当中尤 
其高，但它在青少年中依然 很高： 时间耗用研究（卡内基青少年发展委员 
会，1993, 5,引自 Timmer et al. , 1985 ) 表明，在 9— 14岁的青少年中，电视 
耗费的时间相当于所有其他自由活动（包括玩耍、业余爱好、俱乐部活动、户 
外活动、非正式拜访，以及闲逛）所耗费时间的总和。当然，电视对孩子社会 
化的影响已经被热烈讨论了 30 多年。 从一些杂乱无章的有时相互矛盾的 
结果中，可得出的一个最合理的结论似乎 就是： 过量的电视收看可能会提高 
攻击性（尽管可能不是实际暴力），还可能会降低学业成绩，而且它在统计 
上与“社会心理障碍”有关，尽管这种影响的程度具有自我选择性，并且因 
果关联的程度尚有大量争议 （ Condry , 1993)。如我所说，这些证据尚不足 
以将其 （ 电视） 定罪，但对这些证据的辩护已作了大量说明。 

结论 


伊契尔 • 索勒 • 杵尔 （Ithiel de Sola Pool ) 死后出版的《无边界的技术》 
(Technologies WUhout ， 1990) ，是一本有先见的著作，书中的预见性观点，与 

我们目前关于科技、公共政策和文化这三者间的发杂联系的全国性争论，惊人地相 
关。普尔捍卫一种他所说的“温和的技术决定论”。通讯技术革命已经对社会生 
活和文化产生了深远影响，比如，印刷机有助于促进技术革新。普尔断定，通汛技 
术中的电子单命（甚至在我们意识到迫在眉睫的变化之前，他早就勾勒出了电子革 
命的概貌），是几个世纪以来最重要的技术进步，它将对社会和文化产生一种深远 
的分散性及分裂性的影响。 

普尔所希望的结果可能是“没有邻接的社区”。作为一名杰出的自由主义者, 
他热忱欢迎技术变革为个体自由带来的好处，在某种程度上，我和他一样拥有那份 
热情。我们当中为当代美国社区的减少而感到惋惜的那些人，有必要对自由主义 
者在同一时期所取得的进步作出回应。我们必须避免一种不假批判地向往50年 
代的怀旧之情。另一方面，普尔又预言，同样一些与自由“友好”的技术，其出现实 
际上是暗中破坏我们之间的相互联系，以及我们同我们社区之间的联系。我想，普 
尔也会接受上述论证，因为普尔最有才干的一位门生，萨缪尔 • 波波金 （Samuel 
Popkin,1991, 226-231) 已经论证，电视的出现以及社会互动的相应下降，已经削弱 
了美国的政治话语权。普尔生前的最后一本书 （Pool, 1990, 262) 的最后一行这样 
写道 ：“我 们可以料想，（我们能够预料的技术发展趋势）将促进个人主义，并且将 
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使我们更难（而不是更容易）统治和组织一个融洽的社会。” 

普尔的技术决定论之所以是“温和的”，正是因为他认识到，社会价值可以限 
定技术的影响。最终，这一观点促使我们并不仅仅要思考，技术正如何使我们的生 
活私有化（如果它是这样的话，在我看来它似乎是 的）； 而是要 问：我 们是否完全愿 
意接受这个结果，如果不愿意，我们能够对它做些什么。但那是将来要讨论的 
话题。 
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我们研究了 20世纪90年代美国地方采取经修正的不分区选举制度（祺枳投 
隳制与限制投票制）所导致的少数族群的代表性。我们提出并检验了关于不同地 
方选举制度下的描述性代表的相对比例的假说。我们发现， CV / LV 选举所产生的 
描述性的非洲裔美国人代表，在水平上与那些在更大的单一席位选区所产生的代 
表性接近，并超过那些来自一些小的南部单一席位选区的代表性水平。关于拉美 
人代表性的研究结果更具说服力。我们的结果使一些人欢欣鼓舞，这些人对推动 
少数族群的代表性感兴趣，而这种推动又不必运用在种族基础上划分选区的苛刻 
程序。 

为了少数族群的代表性，美国 M 高法院的近期决策已将更多的注意力指向选 
区划分的各种备选方案 （Pildes & Donoghiie ,1995)。在本文中，我们对修正后的不 
分区选举方案（限制投票制和褀积投粟制）如何能够推进少数族群的代表性进行 
评佔。我们还将考察，如何将这些方案下的代表性与划分选区和不分区选举制下 
所产生的代表性进行比较。 

在前几十年，法院关于《投票权利法案》 （ VRA ) 的解释•扩大了司法部和少数 
族群起诉人的能力，使他们能够对那些可能削弱少数族群选票分最的地方选举方 
案提出挑战（例如 ， Thornburg v . Gingles , 1986 ； Gomez v . , 1988 ) 。通常最 

易受到挑战的方案包括，多席位不分区选举制度下选举产生的议会。对这些情况 

① The Journal of Polities , Vol . 60, No . 4, November 1998, pp . 1108-1125 © 1998 by the 
university of Texas Press , P . 0. Box 7819, Austin , TX 78713-7819. Reprinted with permission of 
Blackwell Publishing . 
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的常规补救措施，是调整为单一席位选区 （ SMD > 方案，并且选区划分有助于促进少 
数族群的代表性。事实上，大墩实质性的证据表明，种族及民族性的少数族群更有 
可能蠃得与他们在分区辖区内的人口份额成比例的席位 （Engstrom & McDonald , 
1981; Polinard , Wrinkle , and Longoria , 1991 ； Welch ,1990)。 


对选区划分的限制 :作为 一种补救措施 


然而，以种族为基础划分 选区已 越来越多地受到法院的仔细审査。“肖诉雷 
诺”案 （1993) 批评了“奇形怪状”的选区。“米勒诉约翰逊案 ”（1995) 发现，多数一 
少数国会选区是违反宪法的，并论证说，选区不应当“从根本上以种族为基础进行 
划分，而不顾常规的及传统的选区划分实践”。“肖诉亨特”案 （1996) 以及“布什诉 
维拉”案 （1996) 发现，个别选区划分方案违反了 《第 十四修正案》的平等保护条例。 
一旦发现种族是选区划分的“主导因素”，当地法院必须对平等保护条例使用严格 
的审査标准。这使得各州及地方政府很难对采纳这样的选区产生真正的兴趣。 

多数一少数选区同样受到指责，因为它们可能“ 浪费” 选票 （ Lijphart ， 1994； 
Still ，1984)。 还有人认为，划分选区可限制少数族群对政策的影响 ( Guinier .1991, 
1994； Sass & Mehay n . d .) ,并阻止跨越种族界限的政党联盟的形成 （ Swain ， 
1993)。这些建议还是存在实践上的问题。爱德华•斯蒂尔 （Edward Still ，1991) 注 
怠到，按非洲裔美国人占其总人 U 65%的代表比例划分选区，或许是在某些悄况 
下促进非洲裔美国人代表性所要求的不能再低的最低限，尽竹布爾斯等人 （Brace 
et al - ,1988) 发现，这个最低比例因地而异。 


美闽的累积和限制投票制 


为了应对已察觉到的选区划分的局限性，有人提议，可采用累积投票制 （CV) 
和限制投票制 （ LV ) 来提高少数族群的代表性。大*中小型的美国辖区已经采纳 
J ’ 这些方案 （Amy 1993； Cole & Taebei , 1992； Cole ， Taebel , and Engstrom , 1990 ； 
Still ，198 4 , 〗 9 91)。②两种制度的采用都是为了选举代表全州的多席位议会，并通 
过对选民投票方式的改变而推进代表比例的均衡。 

北卡罗莱纳州、阿拉巴马州和得克萨斯州的一些辖区，已经采纳修正后的不分 
区选举制度（新墨西哥州、南达科塔州和伊利诺斯州的一些地方也适当采纳了这种 
制度）。在我们写作这篇文章时，超过*75%的市议会、郡议会和学校董事会，都已 


②在美国，只有一个人口超过100 000的辖区采用 CV 或 LV 制度 :伊利 诺伊州的皮奥里亚。 
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采纳 CV 或 LV 。 ③这些选举产生相对较低的排斥临界值，即某一团体在假定所有 
ffl 体的投票者都支持某一候选人的情况下，为了选举这个候选人所需的选票比例。 
例如，在五席位议会的 CV 选举中，某一少数族群候选人即使只获得17%的支持 
率，也不能拒绝其参加对席位的竞争。 

在限制投票制下，投票者受到限制，他们拥有的选票要比有待选举的席位少。 
候选人当选遵循相对多数票原则，获得票数最多的当选，直到所有席位都被填满。 
在政党制度中，有人认为， LV 下的结果越具有比例性，与有待选举的席位数量相关 
的选票就越受限制（相关说明请参见 Lakeman ，1970, 80-88 ； Still , 1984, 253-55)。 
累积投票制对不分区选举制的修正方 法是： 选民的可投票数与应选席位数相同，另 
外，还可以在任何候选人组合之间分配聚集起来的选票。选民可按照自己的意愿 
任意分配选隳，即使所投候选人数 S 少于应选席位数。候选人当选遵循相对多数 
原则，获得票数最多者当选，直到所有席位都被填满…… 

限制和累积投票制下的策略负担 


有理由认为，实行限制投祭制和犋积投琪制的地方，成比例的描述性代表会出 
现一些偏差。在选举制度分类中， CV 和 LV 通常被贴上“半比例性”的标签 （Amy 
1993; Ukeman 1970)。这些修正后的不分区选举方案之所以产生偏离比例性的偏 
差，大部分潜在原因就在于，对每一种制度在大众层面以及精英层面上所制定的战 
略合作 （ C»x 199*7) 的需求。在每一种制度下，某一政党或一个获得提名的团体，必 
须通过控制候选人选举进程的方式 （ 比如，他们列举大蝣最理想的候选人名单）， 
有效地将席位 M 大化。为了使代表锻优化，这些团体还必须将支持者的选票准确 

地分布在他们所提名的那些候选人身上 （ Still , 1984,25 4 -255)。 . 如果一个团体 

提名过多并列举太多的候选人，那么，它就要承担因支持者的选票过于分散而支持 
率不足的风险，这会导致代表名额的不足。如果一个团体所提名的候选人不足，可 
能会导致浪费选票的错误，他们所浪费的选票也许会产生另外一个席位。 

. 为了确保一定的代表性，一个少数族群团体通常只需提名一个候选人（或 

者 r 脆在选票允许的范围内，尽可能多地提名候选人）。……在累积投票制下，对 
提名名单的控制对少数族群的一定比例的描述性代表而言是必霜的，但是，累积投 
票制进一步修正了不分区选举方案，以至于可能会给少数族群造成额外的策略负 
担。运用累积投票制，参选团体必须协调他们的支持者的投票行为。换言之，投票 
者必须被告知在候选人之间分配选票的最优策略。无疑，无论是在大众层面（选票 


③每个辖区的具体制度细节 ，珥 通过与各地地方官员的电话沟通来鉴定。与地方官员以 
及卷人 VRA 诉讼的个人之间的交流能够使我们鉴定这些社区。另外一些地方正着手解决能够 
导致采纳限制投票制或累积投票制的诉讼案。 
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分配）还是在精英层面（候选人提名）上， CV 都要求策略调和，而 LV 可能需要较少 
的策略调和，倘使投票仅限于一个候选人的话。因此，斯蒂尔 （ StiU ，1984, 256) 指 
出，为了获得比例均衡的结果， CV 比 LV 可能需要更多的策略性投票行为（基于少 
数族群投票者在 CV 中犯策略错误的可 能性； 还可参见 Engstrom 1993)。 

由于 CV 允许投票者在投票过程中拥有更大的选择权，所以，即使只有一个少 
数族群的候选人参加选举，这些机会的存在还是提高了一些少数族群的选民在多 
个候选人之间分散选票的概率。这相应地又增加了少数族群选票可能流向非少数 
族群候选人的几率，这潜在地限制了少数族群的有效选票转化为（应得）席位。④ 
而且，在实行 CV 或 LV 的地方，如果某团体的人口份额接近排斥临界值，并且投骐 
行为具有种族上的两极化，那么在这种情况下，少数族群的候选人如果要 当选唯 
一的可能就是他们的支持者积极出来投累，投栗人数的比例能与多数团体的选民 
相抗衡。所有这一切都表明，相比在 LV 之下所获得的代表性而言， CV 下的描述 
性少数族群代表，可能在一定程度上同总人口更不成比例。 

有理由认为，相比单一席位选区制 （ SMD >, 每一种方案都酊能产生不怎么成比 
例的描述性代表,，采用 SMD 方案，如果谋划者有能力裁定选区边界，以便大敢地 
创逑少数族群选区，并创造许多在一个辖区内与整个多数派选票份额相当的少数 
族群选区，那么，产生成比例的描述性代表就有指望。与 CV 和 LV 相比，一旦均质 
的多数 派一少 数派选区被创造出来，那么，为了产生比例均衡的描述性代表 ，对枏 
英策略行为的要求就很有限（例如，动员大 tt 少数族群的投琪者设法接近多数派团 
体的投费者，并控制提名 名单） •并且对选民策略性投票行为的嬰求也很少 （例 如， 
敗布选柴）。⑤换句话说,选区划分能够使推进少数族群代表性所厢要的一些策略 
行为制度化，而且可能比 CV 和 LV 产生更多的少数族群代表。 

假 说:修 正后的不分区投票制的结果 

上述讨论间接表明了一些可检验的主张，这些主张与以下问题有 关：修 正后的 
不分区（锊代方案）选举中的席位一人口关系•如何与那些在分区选举以及未修正 
的不分区 （ AL ) 选举方 案下所 获得的关系进行比较，以及 LV 和 cv 替代方案相互 
之间如何进行比较。 


④ 对一个运用 CV 的城市的调査报告显示,36%的拉美裔选民利用可选择的权利将他们 

的至少张选票投向非拉美裔的候选人 （ Cole , Taebel , and Engstrom , 1990; Cole & Taebcl 
1992) 0 ’ 

⑤ 当少数族群团体在空间上高度隔离的时候•最优的选区划分安排便成为可能。由于非 
洲裔美国人的居住地一直以来都比拉美人的居住地更脱离白人的居住地 （Massey & Denton , 
1987 )， 所以，相比拉美 人而言 ，选区划分可能会产生更成比例的非洲裔 美国人 的代表 （Taebd , 
19了8;另参见 Vedliiz & Johnson, 1982 ) 。 
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首先，我们认为，修正后的不分区选举制度 （ cv 和 LV ) 应当比传统的不分区方 
法产生更成比例的少数族群代表。假定某团体大致结成一伙迸行投票，那么，贏得 
相对多数的任何一个团体，均有可能在未修正的不分区选举中将所有席位尽收囊 
中 （ Lak eman ，1970)。 尽管几乎所有投票制度都偏向选举过程中获得最多选票份 
额的团体，但在美国风格的不分区的、相对多数票制下，这种偏向最严重 （ Johnson , 
1979)。相反， LV 和 CV 均比不分区选举制具有更低的排斥临界值…… 

其次 ，一 旦策略要求和 CV / LV 的“半比例性”的本质已定，我们便能料想到，相 
比 SMD 选举而言，修正后的不分区选举可能会产生相对不成比例的描述性的少数 
族群代表。⑥修正后的不分区选举方案，降低了某一少数族群候选人贏得席位所 
需选票的最低限，通过这种方式，它可以推进少数族群的代表性，但是，参选团体必 
须在政治上很好地组织起来，才能隼控这些制度。单一席位选区制对精英和大众 
的合作要求相对较低，在此情况下，便能推进少数族群的代表性。 

再者，限制投票制比累积投票制有望产生更成比例的结果。这一假设建立在 
如下假定的基础之 上：累 积投敷制可能要求投票者和精英之间某种额外的策略行 
为因索（凋和分散的选票）。 


数据及分析框架 


我们所检验的案例均取自美国的市、郡以及学校的选区，这些选区都采纳 CV 
或 LV , 以应对实际的或预期的 VRA 诉讼。相对于少数派团体在当地总人口中所 
占的比重而言，选举制度如何与他们的代表性相关，由于我们对研究这一问题感兴 
趣，所以我们只分析1990年人口普査所覆盖的一些辂区。有关地方选举制度和选 
举结果的原始信息，是在1995年春通过与市政秘书及乡镇选举官员的电话访谈获 
得的，随后在1996年与1997年又进行了访谈，获得了更多数据。我们所验证的几 
乎所有地方都位于这三个州 ：得克 萨斯州、阿拉巴马州和北卡罗莱纳州。南达科塔 
州、新墨西哥州和伊利诺斯州也各有一个辖区采用了褀积投票制。我们将我们的 
分析限定在来自以上六个州的一些地方，在这些地方，占主导地位的少数族群总共 
也不及投琪人口的50%。 . 

我们将单次选举作为分析案例。这增加了分析的可比性，主要原因在于，这种 
做法减弱了那些将一些选举交错进行的辖区所引起的问题。我们的分析包含每一 
辖区的两次最近的 选举； 如果某辖区截止到1997年春只进行一次 CV 或 LV 竞选， 
则选取最近的一次进行分析。这使得我们能够捕捉地区间及地区内各项选举间的 


⑥这种逻辑并非意味着•相比多席位的 LV 或 CV 制度而言，任何一个（全国性的）运用 
“赢者通吃”、单一席位选区的选举制度，就一定会产生出更成比例的结果。注意到这一点很重 
要:我 们所料想的比例差异，与其说是单一席位选区本身的一个函数，不如说是种族性和民族性 
群体被指派到特定选区的一个函数， 
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表1个案的种族/民族分布 


占主导地位的 

总选举次数 

少数族群候选人 

少数族群获胜 


少数派团体 

参加的选举次数 

的选举次数 


美籍拉美人 

66 

47(71%). 

33(50%) - 





(70% ” 


非洲裔美国人 

28 

26(93%)* 

25(89%)* 





(96 %) b 


美国土著人 

02 

01(50%)* 

00(0% ) mh 


a . 所有选举次数的百 分比； 


b . 有少数族群候选人参加的选举次数百 分比； 

注： 单次选举作为 案例。 数据来自最近两次 选半； 如果某一辖区截止到1997年只进行过一次褀积投槊 
制或限制投祭 制汔选 ，则数据宋源于最近举行的一次选举^ 


差异，因为大多数社区在连续选举中均改变了他们所角逐的席位数贵。我们的数 
据来源中，只有三个地方的倒数第二次选举是在1990至1992年间举行的，其他所 
有地方的 M 近两次竞选都是在1994至1997年间进行的。 

因变 M 是少数族群候选人在每次选举中所嬴得的 CV 或 LV 席位的百分比。 
这样一来，我们的模型就将席位一人口关系与修正后的不分区选举之间的独特关 
系分离出来，并在分析中排除了这些团体通过其他选举方法所蠃得的席位。⑦席 
位一人口分析所涉及的社区仅限于人 U 超过丨000的地方，这是人口枰杳数据中 
包含种族信息 的最低 人口数大多数社区人口规模相当小，中位数为3 167人， 
平均数为10 311人。用以评估席位一人口关系的 M 终样本，包括62个辖区所提供 
的96次选举的全部数据。 

表1表明，少数族群在角逐这些选举时 锊取得 过成功，尽管在选举制度改变以 
舫，其代表性程度处在较低的水平上。在累积投票制下，在拉美候选人谋得官职的 
70%的选举角逐中，都有拉美候选人参选。而且，在非洲裔美国人 i 某得官职的96% 
的 CV / LV 选举中，至少一位非洲裔美国人当选。表1还具体说明了我们将在下文 
讨论的 内容： 占主导地位的少数族群为拉美人的选举中，仅有71%的选举有拉丁 
裔候选人参加。 

关于如何将少数族群达到投票年龄的人 n 份额转化为地方议会中的席位的假 
说，可以通过对相对于人口的席位进行回归分析的方式来检验 （EngMrom & 
McDonald , 1981)。双变最回归产生斜率估计值，它们可以被用来估计不同选举制 
度下的席位一人口关系的差异，并且可以与其他使用类似方法的研究所产生的结 
果相 比较。 例如，当运用百分比数据时，截距为0的 1.0 的斜率表明，少数族群在 


⑦例如，倘若某地举行的选举中，有五个席位是通过累积投票制（或限制投票制）产生的， 
则因变量的计算方 法为: 少数族群候选人贏得的累积投票制产生的席位数/5。类似地，如果五 
个席位中有三个是通过划分选区方法产生的、两个是通过累积投票制产生的，那么因变量的计 
算方法则为 •.少 数族群候选人贏得的累积投票制产生的席位数/2。 
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地方议会中所占的席位份额，与当地达到投票年龄的少数族群人口的百分数始终 
保持一致…… 

如表2所示，用于所有 CV 和 LV 辖区的模型首次得到评估，案例中占主导地 
位的少数派团体，包括非洲裔美国人、美籍拉美人和美国土著人（模型 2. 丨）。⑧接 
下来，我们评估了分别对应于非洲裔美国地区和拉美地区的两组模型，旨在评定， 
对这些团体而言，修正后的不分区投票制是否与一种不同的席位一人口关系相关 
( 分别为模型 2. 2和 2. 3 ) 。而且，我们还运用交互作用项和虚拟变最，评估用于所 
有案例的多重变屋:模型，以检验少数族群的代表性在 LV 下是否比在 CV 下更接近 
常规标准（模型2. 4 )。为了评价其他假说，我们将这些模型所产生的斜率，与其他 
研究所产生的斜率进行比较。这种比较可为下述问题提供一些看法 ：经修 正的不 
分区选举制下的少数族群的代表性，如何与美国地方所采用的其他选举制度进行 
比较。 

有关这些关系的斜率的信息比一种简单的证明更重要，这种简单证明即 是：在 
调整为经修正的不分区选举制以后，越来越多的少数族群加人地方议会。每一个 
辖区都采用了新的选举制度，因为它们都拥有数敵可观的少数族群人口，而少数族 
群的代表相当有限（多数地方甚至没有少数族群的代表）。它们当中只有两个地 

表2累积投票制与限制投累制下的少数族群的席位一人口关系 



換型 2.1 

模® 2. 2 

模型 2.3 

模咽 2.4 

变》 

_ 囑 _ ™— ■ _ 

(所有案例） 

(黑人 案例） 

(拉美人案例） 

av ) 

少数族群法定选 

0. 15 

0. 95 •- 

0.03 

0.01 

举人口百分比 

(0.18) 

(0.13) 

(0.21) 

(0.18) 

LV 虚拟变撤 

— 


— 

-0. 19 

(0.15) 

LV 选举制下少 

数族群法定选举 
人口百分比 




1 . 12 - 

(0.48) 

截距 

0. 15 #B 

0.04 

0. 16 

0. 17** 

R 2 

<^.1 Ar\l 9^4 

(0.06) 

(0.08) 

(0.07) 

(0.06) 

0.01 

0.26 

0.00 

0. 12* 



• •模 2.4 的#逛调整 过的； 其他都未调整> 

*• P < 0.05 ； *** p < 0.01 (双尾 t— 检验） 

注：因 变域=每次选举中少数族群候选人嬴得的祺枳投票制或限制投票制席位数/每次选举中总共的累 
积投票制或限制投票制席 位数。 表格中填写的是非标准回归系数，或者因变看与自变贵之间关系的 
斜率。 


⑧在一个只实行累计投票制的辖区 （ Sissetcm , SD 学区），占主导地位的少数派团体是美国 
土著人。 
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方的少数族群人口少于10% (最少的为7%)。⑨我们的分析所涉及的多数（即使 
不是大部分）辖区，在修正后的不分区选举制下，少数族群的代表性得以提高。我 
们的模型说明了这一过程的系统性本质，在某种意义上推动了与其他选举制度的 
研究的比较。 


结果 

模型 2. 1的结果显示，当所有经修正的不分区辖区同时被考察时，少数族群的 
人口和少数派群体所控制的席位百分比并不匹配 a 当我们分别考察非洲裔美国辖 
区和拉美辖区时，经修正的不分区选区之间的席位一人口关系的变化是明显的。 
当我们单独考察非洲裔美国辖区时 （ 当分析局限于黑人候选人的案例时，/? 2 增加 
至0. 4 5),这一模型的拟合度大大提高 （# =0.26) o 模型 2.2 表明，相对于这些选 
区而言，席位和少数族群法定投票人口之间的关系，可由一条斜率为0.95、截距接 
近 0( 差异不显著）的斜线表示。因此，在主要少数族群为非洲裔美国人的地方，随 
猗人口中少数族群份额的增加，描述性代表也相应地增加。而且，由于截距接近 
0,所以人口份额在较低的水平上转化为少数族群人口的代表。 

针对占主导的少数族群为拉美人的地方，模型 2.3 指明了席位一人口关系的 
斜率。 倘若斜率不显菁并且极低，那么，少数族群的人口份额和少数族群在议 
会及学校*亊会中所占的席位份额之间，似乎就不存在实质的线性关系。这并非 
意味狩，在采纳经修正的不分区选举制的地方，拉美候选人并未当选。与多数非洲 
搿美国辖区一•样，在调整为经修正的不分区选举制以后，拉美候选人大最当选。如 
表1所示，在拉美候选人谋求公职的案例中，有超过一半 （33/47) 的悄况是成功 

的-相比这些社区先前的拉美裔的代表性而言，这标志莜一种巨大的改进 

( Bri 8 chetto , 1995 ； Brischetto and Engstrom , 1998 ) 。然而，很多拥有大墩拉美裔人口 

的地方，选举却没有产生拉美裔代表，究其原因，可归咎为拉美裔候选人的缺乏 （以 
及）民意调査的缺陷。就算只分析拉美裔候选人谋求公职的案例，效果仍不显著 
(本文未作阐述）。在讨论部分，我们将对席位一人口模型如何低估拉美裔代表性 
的潜在性进行阐述。 


⑨例如，托马斯和斯特瓦特 （Thomas and Slewart ，1988,171 ) 注意到，1982年联邦政府所研 
究的阿拉巴马州占主导地位的黑人区中，有44%的乡村没有黑人代表 （美 国公民权利委员会， 
1983,引用自 Thomas and Stewart ， 1988)。这些没有黑人代表的乡村中，大部分都是黑人人口占 
多数。许多城镇都是由这些乡村组成的。自1964年以来，北卡洛莱纳州中每一个采用 LV 的地 
区，都在《投票权利法案>的管辖范围之内。基奇和西斯特罗姆 （Keech and Sistrom , 1994 ) 报告 
说，截止到1989年，90%的北卡洛莱纳州乡村和城市使用的是未修正的不分区选举制。这些地 
方的黑人代表名额严重不足。在黑人是少数族群的地方，代表权益分值不超过0.20。几乎所有 
的北卡洛莱纳州的案例都来自这些社区。 
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非洲裔负 W 人法定选举人 u 百分比 

图 1 CV/LV 席位一人口关系与美国南部其他选举制度的比较 

实线=选区制 （Welch J 990) 

虚线=不分区制 （ Welch . l 990> 

点线=修正后的不分区选举制 （ CV / LV ) 

我们假设，相比标准的不分区选举方案而言，这些新的经修正的不分区制度将 
产生更成比例的描述性代表，而相比 SMD 方案而言，这些制度又产生出更不成比 
例的代表。将我们的換型的结果与其他的考察美国地方选举制度的研究结果进行 
比较，我们的结果被证明是合理的。如果我们将经修正的不分区制度下的非洲裔 
美国人代表性的斜率和截距，同关于标准的不分区选举制的先的研究的斜枣和敝 
距进行比较，我们会发现一些证据支持这些假说。 

如图丨所示，近期经修正的不分区投栗制下的非洲裔美国人的席位一人口关 
系，与威尔奇 （Wek*h，1990) 所发现的少数族群为黑人的采用 SMD 的南方大城市 
(居民超过5万人）中的非洲裔美国人的席位一人口关系类似。图1将我们的模型 
2.2 的结果与威尔奇的发现进行了比较。综观少数族群人口范围的许多区域，修 
正方案 （CV/LV， 由点线表示）所产生的代表水平似乎与分区制（实线）所产生的 
表水平类似，并且比标准的不分区方案（虚线）产生出稍微多一些的描述性代表。 

由于我们近乎所有的案例均来自相对较小的选区的选举，所以威尔奇的数据 
可能不是最好的适宜于比较跨选举制度的席位一人口关系的数据。另外有一项对 
其他最近放弃 AL 方案的南方选区的研究，这项研究包含许多与本研究所包含的社 
区更为类似的较小的乡村选区。当把我们的估计值与这项研究的结果相比较时， 
我们发现，在修正后的不分区选举方案下，非洲裔美国人的代表水平更为突出。布 
洛克 （Bullock, 1994) 研究了 1991年乔治亚州乡委员会选举情况。所研究的乡镇 
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图 2 CV/LV 席位一 人口关 系与南 部较小地区的 其他选举制度 的比较 

实线=选区制 （ Bullock ,1994) 

虚线=不分区制 （ Bullock , 1994 > 

点线=修正后的不分区选举制 （ CV / LV ) 

中，有52个采用单一席位选区制，比1981年的17个有所增长。⑩图2绘制了单一 
席位选区制下的布洛克的席位一参加投琪人数的双变 K 关系图（实线），以及我们 
在模型 2. 2中所评估的使用 CV / LV 方案的非洲裔美国辖区的关系图 （ 点线）。该 
图所 M 示的结果与我们的一个假设相悖——当与分区选区相比时，经修正的不分 
区选举实际上会产生稍微更成比例的结果。 

当我们将我们的估计值与布洛克关于乔治亚州乡镇的研究结果进行比较时， 
我们发现，标准的不分区选举与 CV / LV 选举之间存在实质差异，并且这种差异与 
我们的一个假说相容，这个假说 就是： CV / LV 方案比传统的 AL 制度能产生更成比 
例的少数族群的代表。图中虚线所表示的是，1991年仍然使用未修正的 AL 选举 
制的41个乔治亚州乡镇的双变最的席位一参加投票人数关系。与这些案例相比， 
经修正的不分区选举制实质上产生了更多的非洲裔美国人的描述性代表。⑪ 

我们的最后一个假说处理 LV 和 CV 制度下的结果间的差异。由于 LV 方案可 


⑩与我们当时所研究的案例类似,许多地方都刚刚放弃 AL 方案，以应对第二节所提到的实 
际的或潜在的违反 《投票 权利法案>的行为。与我们的研究一样，布洛克的研究案例也局限于少数 
族群为非洲裔美国人的地方 (" = 149 个乡镇）。由于大多数的这些选区都刚刚转换选举制度，而 
且大多数地方都具有人口稀少和乡村特点，我们认为它们是与本研究作比较的良好参照体。 

⑪我们的模型将少数族群的法定选举人口的百分比用作关键自变量，而布洛克所使用的自 
变景是少数族群投票人数的百分比，考虑到这一情况，我们对 CV / LV 的估计与布洛克对不分区选 
举制和单一席位选举制的估计之间的差异更明显。倘若人口与选民登记数之间存在差距，那么我 
们的预测便有可能偏离发现成比例的关系，当运用参加登记投票人数时，这种现象是明显的。 
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表 3 累积投票制与限制投累制下的非洲裔美国人的席位一人口关系 


变量 

模型 3.1 

(仅限累积投票制） 

模型 3. 2 

(仅限限制投 票制） 

少数族群法定选举人口百分比 

0.60- 

1.12* 


(0.25) 

(0.61) 

截距 

0. KT . 

-0.02 


(0.04) 

(0.19) 

R 2 

0.38 

0. 19 

案例数撖 

11 

17 


♦p < 0. 10 ； ♦ ♦p < 0.05( 双尾卜检验) 


注：因 变撤=每次选举中少数族群候选人贏得的 CV 或 LV 席位数/每次选举中总共的 CV 或 LV 席位 
数 3 表格中填写的是非标准回归系数， 

能涉及较少的策略负担（例如选票分布调和），所以我们期望，限制投票制能够 
比累积投票制产生更多的少数族群代表。模型 2. 4包含一个系数，它反映了表 
示 LV 选区的虚设物和少数族群法定投票人口之间的交互作用。理论上，这一 
系数将累积投票制下的席位一人口关系单独分离出来。当我们比较 LV 和 CV 
选区时，交互作用项的显著系数 （1.12; p <0.05) 可被认为反映了更成比例的少 
数族群的描述性代表。这与有效使用对策略要求更低的假设一致。 

有必要强 凋：表 2(/ V =17) 的分析包含相对较少的 LV 案例，并且这些案例 
都来自占主导地位的少数族群为非洲裔美国人的地区。⑫模型 2. 4 中的交互作 
用，可能会反映出 LV 下的非洲裔美国人的代表性与 CV 下的拉美裔及非洲裔美 
国人的代表性之间的差异。 

另外一种确定少数族群是否在 LV 下实现更高代表性的方法，就是评估28个含 
有非洲裔美国少数族群选区的席位一人口关系的斜率。如表3所示，我们首先评估 
使用累积投票制地区所独有的席位一人口关系的斜率（模型 3. 1 ), 然后将其与使用限 
制投票制的非洲裔美国地区的席位一人口关系的斜率相比较（模型3.2)。表3记录 
了比较的结果。我们再次 发现: 有证据证明， LV 选举制 （b = 1.12, P = 0.08) 下的少 
数族群人口与席位的关系，比累积投票制 （b =0.60, p <0.05) 下的少数族群人口与 
席位的关系更成比例（或者超过比例）。⑬但是， LV 下的人口一席位系数并不明显大 
于 CV 下的系数。表3中的人口一席位模型的斜率和截距值的确显示，当黑人人口 
份额接近50%时, CV 社区黑人候选人的当选率与布洛克所分析的分区选区的当选 
率几乎一样。在黑人人口较少的范围内，模型 3.1 的截距表明， CV 比布洛克的 SMD 
选区产生更多的代表。 


⑫不同的非洲裔美国地区之间.均会发生所有的选举变化。 

⑬对这些斜率间差异的 t 一检验并未产生显著的差异。小规模的样本限制了这一检验的效 
力。当把表3中所有28个案例的交互作用 （LV mmority % VAP ) 考虑在内的时候，系数为正 （b 
= 0.52) 但不显著。 
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这些虚假变量无法控制许多额外的选举制变化的因素 （限制 选票的程度、 CV 或 
LV 选举产生的所有席位的比例、辖区使用 CV 或 LV 的年份，等等）。篇幅限，我们 
无法将所有这些因素都包括在内，因而也就无法确切地得出结论，美国实行的 LV 比 
CV 产生更成比例的少数族群的代表。 

最后，我们应当注意到，我们有理由料想到，有待竞选的席位数量会影响到任何 
选举制度的比例性 （Lijphart 1994) o 我们的确将这一因素作为自变娀包含在最初的 
模型中，但效果并不显著。由于我们的 H 的是复现其他并未包含这一因素的研究模 
型，所以本文所报告的模型并不包含这一因素。在这些选举制中，参选的席位数世存 
在有限的变化，所以很难评价这个变鼠的影响 • 


讨论 


我们的数据提供证据表明，采用限制或累积投琪制修正地方不分区选举制，有權 
产生与单一席位选区制下所发现的水平相当的少数族群的代表性。这一发现应该会 
鼓舞这样一些人,他们致力于促进少数族群的代表性，而又不依赖于基于种族划分选 
区的苛刻程序。先前研究业已证明，少数族群的确在修正后的选举方案下窳得 席位。 
我们的目的是要验证 CV / LV 下的席位一人口关系如何与其他方案下所产生的关系 
进行比较。对非洲裔美国人而言， CV / LV 选举制下的代表性可以顺利地与单一席位 
选区制下所获得的代表性进行比较.而且比未修正的不分区选举制下的代表性史成 
比例。对于本文所研究的社区中拉美人而言，情况并非如此。 

我们对关于拉美地区的研究结果提出如下问题：为什么选举结果更不成比 
例。在本文所研究的案例中，我们的估计所反映出的比例不足，可能与以下三方面因 
家的作用相关:（1)拉美裔候选人选拔 不足； （2) 对拉美裔达到法定投票年龄的人口 
的普査测最（这些模型的关键自变*)，与实际参加投票的拉美裔人口之间存在实质 
差距； （3) 占主导地位的少数族群为拉美人的许多地区所采用的 CV 方案本身具有较 
离的排斥临界值。 

在我们的案例中，大贵的德克萨斯州的 CV 选举 （ /V = 33 ) 实际上拥有拉美人口， 
却并未实现拉美人的代表性。在其中的19宗案例中，市政员指出，没有少数族群候 
选人参加竞选。同样，只有两宗案例中非洲裔美国人构成主导地位的少数派群体，但 
没有非洲裔候选人谋得公职。数据显示，提名问题对拉美辖区更重要，由于这个原 
因，提名不足可以部分解释为什么在拉美人占主导地位的辖区，席位和人口份额之间 
缺少一种线性关系。 

另外还有14宗案例，拉美裔候选人在拉美裔人口明显占主导地位的地区被击 
败。 第二个重要因素，影响到我们估计修正后的不分区选举制下的拉美人的代表性 
的能力，这一因素就是运用普査测*达到法定投票年龄的人口。在本分析所包含的 
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大多数拉美地区中，拉美裔参与投票者比白人参与者要少很多。 ® 少数族群法定选 
举人口的百分比数据，可能会产生出比过去所运用的登记投票人数或出席投票人数 
的数据所产生的估计斜率更低，因为后者更精确地反映了少数族群的选举力量。同 
样，法定投票人口的普査测 M 与实际出席率之间的差距，相对于非洲裔美国人而言， 
可能要比相对于拉美人而言更小。当拉美人出席投票的人数数据包含在一个局限于 
14个德克萨斯州的社区（在这些社区中，这些数据是可资利用的，并且拉美裔候选人 
在1995年谋得了公职）时，拉美裔席位一出席人数的关系斜率为 1.22(# =0.30), 
并且这一结果具有统计显著性。⑮这表明，当拉美投票者被动员起来时，拉美裔候选 
人在累积投票制下可以做得很好 a 

第三个因素是加重人口与出席投票人数之间的差距。德克萨斯州的大部分地 
区，每一 次申一 选举往往只设两到三个通过累积投票制竞选的席位。本文的分析案 
例，除两个以外其余的所有拉美裔案例均来自德克萨斯州。这意味着，德克萨斯州的 
排斥临界值通常为25%或30%。当排斥临界值如此高的时候，较低的少数族群出席 
投琪人数便成为突出问题。 

我们应当强调，解释低水平的拉美裔代表性的这些因索中，没有一种因素是采用 
修正后的不分区选举制度自动产生的结果。毋宁说，限制因索就在于 ：一些 CV 方案 
如何加以设计，团体如何利用这种选举制度。如果一次选举中根据累积投票制竞选 
的席位不超过两个，那么任何少数族群都将难以贏得席位，除非他们以团体形式投 
祭，并控制相当规模的法定选举人口份额（接近或超过33%),并且动员投票者参加 
投票，直到投棋人数与多数派团体的投 票者持 平甚至超过。 

然而，如果选举方案产生的排斥临界值，并未超过少数派团体的选举力畎，并且 
少数派政治团体有良好的组织，以至于能够选拔候选人甚或对提名有所控制，并且或 
者动员投票者将所有选栗投给某一（些）候选人，那么，与累积投票制和限制投稱制相 
关的许多策略负担就能克服。我们的结果表明，这些负担显然能够被克服，而且 CV / 
LV 方案的确有助于少数派团体在易实现的条件下获得成比例的描述性代表，同时又 
避免使用具有种族意识的选区划分。我们的结果表明，与累积投票制相关的许多策 
略负担和合作要求，很容易被少数族群候选人克服 9 


⑭在其中的两个辖区内，少数族群参与投票的人数实际上超出英裔美国人的投票人数，而 
且少数族群候选人成功当选。投票人数的数据来自 Brischetto and Engstrom ，1998。 

⑮德克萨斯州使用累积投票制的地区•只能得到1995年的种族团体参加投票人数的数据。 
当年，在15次德克萨斯州累计投票制选举中，拉美裔候选人谋得公职，登记投票人数的数据报给 
其中的 M 个地区。因此，我们无法运用所有％宗案例来准备相似的估计。这些数据来自 
Brischetto and Engstrom , 1998 0 
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